تحقیق درباره ارزش اطلاعاتی و ارزش اطلاعات

دانلود پایان نامه

برای تدوین مطالب این فصل از منابع زیر استفاده شده است : لی و مارتین(1987)،گرووز(1989) ، دلو(1992) ، لایبرگ وکاسپرژیک (1997) ، ترنر،فورسایت، اوریلی، کولی، اسمیت، راجرز و میلر( 1998)، دلو، هاکس، و اسنیجکرز(1998)، ماتیوویتز(1999) ، وان هاتوم و دلو(1999)، ، کراسنیک (2002)، روبین و لیتل (2002)و دلو، هاکس و هویسمن (2003) .


5-2 گونه‌شناسی داده‌های گم شده
هرگاه داده‌ها با پرسشنامه یا مصاحبه گردآوری شوند، داده‌های گم شده رخ خواهند داد. چند الگو از داده‌های گم شده وجود دارد و هریک از آنها می‌تواند به راههای متفاوت و به‌وسیله عامل‌های متعدد اتفاق افتد. برای آنکه به‌طور موفقیت‌آمیز از داده‌های گم شده پیشگیری کنیم و با آنها درست رفتار کنیم لازم است که انواع مختلف گم شدگی را که ممکن است ظاهر شوند تعریف کنیم و بفهمیم و الگوهای داده‌های گم شده واقعی را به تجربه دریابیم.
5-2-1 گم شدگی تصادفی و غیرتصادفی
تفاوت اساسی در داده‌های گم شده آن است که داده‌ها:
1) گم شده کاملاً تصادفیاند (MCAR) یا 2) گم شده تصادفیاند (MAR) ویا 3) گم شده غیرتصادفیاند (NMAR) .
داده‌ها را گم شده کاملاً تصادفی (MCAR) گویند اگر گم شدگی یک سؤال به مقدار مجهول آن پاسخ و نیز به مقادیر پاسخ‌های مربوط به سؤال‌های دیگر مرتبط نباشد، مثلاً مصاحبه‌گر در حین مصاحبه یا در پرسشنامه پستی پاسخگو تصادفاً سؤالی را جا می‌اندازد. در حالت گم شده کاملاً تصادفی، مقادیر گم شده نمونه‌ایی تصادفی از همه مقادیرند و به هیچ متغیر مشاهده شده یا مشاهده نشده ارتباط ندارند. بنابراین نتایج تحلیل داده‌ها اریب نخواهند بود، زیرا تفاوت سیستماتیکی بین پاسخگویان و بی‌پاسخ‌ها وجود ندارد و مشکلی که پیش می‌آید عمدتاً مربوط به کاهش توان آماری است.
وقتی که گم شدگی به داده‌های مشاهده شده مرتبط باشد اما به مقادیر مجهول پاسخ گم شده به خود سؤال مربوط نباشد، گویند که داده‌ها گم شده تصادفی‌اند (MAR) . مثلاً ، یک پاسخگوی سالمند با مشکل به‌خاطر آوردن واقعه‌ای به‌دلیل ضعف حافظه روبه‌رو باشد، داده گم شده تصادفی خواهیم داشت. گم شدگی حاصل مربوط به سن است نه به خود سؤال. وقتی داده‌ها گم شده تصادفی‌اند گم شدگی فرایندی تصادفی است که مشروط به داده‌های مشاهده شده است. به بیان دیگر، مقادیر گم شده نمونه‌ایی تصادفی است از همه مقادیر موجود در رده‌هایی که به‌وسیله مقادیر مشاهده شده تعریف می‌شوند. در مثال پاسخگویان سالمند داده‌ها نمونه‌ای تصادفی درون زیر گروه‌های‌اند که برحسب سن ساخته می‌شوند. اگر داده‌ها گم شده تصادفی (MAR) باشند و مدل آماری درست به‌کار رود، گویند گم شدگی نسبت به نوع ویژه‌ای از استنباط (مثلاً روش‌های مبتنی بر درستنمایی، یا بیزی) قابل چشم‌‌پوشی است. مثلاً، در مورد پاسخگویان سالمند، متغیر مرتبط با گم شدگی (سن) اندازه گرفته می‌شود و برای گنجاندن در تحلیل درست (مثلاً، جانهی، یا تعدیل با وزن‌دهی) در دسترس است.
سرانجام، وقتی گم شدگی مرتبط با پاسخ (گم شده) مجهول به خود سؤال باشد، داده‌ها گم شده غیرتصادفی‌اند (NMAR) . مثلاً، پاسخگویی حس می‌کند که پاسخ واقعی‌اش از نظر اجتماعی نامطلوب است و با گفتن ”نمی‌دانم“ یا ”بی‌پاسخ“ از دادن پاسخ طفره می‌رود.اگر داده‌ها گم شده غیرتصادفی باشند اریبی جدی ممکن است رخ دهد. در آن حالت، گم شدگی را غیرقابل چشم‌پوشی گویند و هیچ راه ساده‌ای برای رفتار با این داده‌های گم شده وجود ندارد.
باید مدلی برای گم شدگی فرض شود و برای جلوگیری از اریبی در تحلیل به‌کار گرفته شود. برای تصمیم‌گیری درباره اینکه کدام الگو و ساختار بی پاسخی مطرح است و چگونه بی‌پاسخی سؤال را در تحلیل‌های آماری درمان کنیم، مهم است که الگوهای گم شدگی داده‌ها را بررسی کنیم.
5-2-2 تعریف‌های بی‌پاسخی و الگوهای داده‌های گم شده
نخستین نوع گم شدگی بی‌پاسخی واحد است، که در آن حال داده‌های مربوط به کل واحد برای تحلیل آماری در دسترس نیستند. کل سابقه ممکن است به این دلیل از بین برود که نتوان با برخی واحدها تماس گرفت، یا همکاری نکنند، یا به این دلیل که پرسشنامه یک واحد که همکاری کرده بود در خلال ویرایش داده‌ها یا تحلیل داده‌ها گم شود.
بی‌پاسخی واحد را اغلب بی‌پاسخی نوع اول گویند. بی‌پاسخی سؤال را بی‌پاسخی نوع دوم گویند که در این حالت واحد همکاری کرده است اما داده‌های سؤال‌هایی خاص در دسترس نیستند. اصطلاح در دسترس نیستند را به عمد به کار برده‌ایم. اینکه پاسخی را گم شده محسوب کنیم به هدف بررسی بستگی دارد. برای مثال، پاسخ ”نمی‌دانم“ می‌تواند به‌عنوان پاسخی با معنا به سؤالی درباره قصد رأی دادن در یک انتخابات تلقی شود. برای سؤال‌های دیگر (مثلاً، درآمد) ”نمی‌دانم“ هیچ ارزش اطلاعاتی ندارد و گم شده محسوب می‌شود. بنابراین، پاسخ یک سؤال وقتی گم شده است که پژوهشگر آن را گم شده تعبیر کند، و تصمیم به درمان آن (مثلاً، جانهی) بگیرد.
در داده‌های گم شده سؤال سه الگو را می‌توان تشخیص داد: (1) داده‌ها بنابه طرح به‌طور سیستماتیک گم شده‌اند، (2) همه داده‌ها پس از نقطه‌ای معین از پرسشنامه گم شده‌اند (بی‌پاسخی جزئی)، و (3) داده‌ها برای برخی سؤال‌ها در مورد برخی پاسخگویان گم شده‌اند (بی پاسخی سؤال).
هر الگو به چند دلیل ممکن است رخ دهد، که ذیلاً با تفصیل بیشتر بحث می‌شوند برای درمان داده‌های گم شده مهم است که بدانیم داده‌های گم شده چگونه اتفاق افتاده‌اند.
گم شدگی بنابر طرح
در حالت گم شدگی بنابر طرح، پژوهشگر تصمیم می‌گیرد که برخی سؤال‌ها را از برخی پاسخگویان نپرسد. دو دلیل عمده برای سؤال‌هایی که بنابر طرح گم شده‌اند، وجود دارد.
اول، داده‌ها گم شده‌اند زیرا برخی سؤال‌ها در مورد همه پاسخگویان مصداق ندارند و مسیر پرسشنامه از این سؤال‌ها می‌گذرد. این حالت را گم شدگی برحسب منطق نیز می‌نامند. مثلاً، سؤال‌های مربوط به بچه‌‌ها را از کسانی که بچه ندارند نمی‌پرسند، یا در بررسی‌های بهداشتی اگر پاسخگویی هرگز یک بیماری را نداشته است سؤال‌های پیگیری آن بیماری را نمی‌پرسند.
مصداق داشتن سؤال‌ها بستگی به خصوصیات پاسخگو دارد که کار کردن با داده‌های گم شده را در مجموعه داده‌ها نسبتاً آسان می‌سازد. گم شدن برحسب منطق به این دلیل رخ می‌دهد که پاسخی واقعی برای سؤال وجود ندارد و دلیل آن برای پژوهشگر معلوم است. به بیان دیگر، مقادیر سؤال‌های دیگر گم شدگی را تعیین می‌کند، بدین‌ترتیب مکانیزم گم شدگی برای تحلیلگر آماری دست‌یافتنی است و می‌تواند در تحلیل‌ها شرکت داده شود.
دلیل دوم برای گم شدگی اقلام سؤال بنابر طرح، وقتی است که گم شدگی با استفاده از طرح خاص برای پرسیدن مجموعه‌های متفاوت سؤال‌ها از اشخاص مختلف حاصل می‌شود. برخلاف گم شدن بنابر منطق، در این حالت همه سؤال‌ها در مورد همه پاسخگویان مصداق دارند. اما، پرسیدن همه سؤال‌ها منجر به پرسشنامه‌های بزرگ و ساعات بسیار زیاد برای تکمیل آنها خواهد شد.
گنجاندن الگو و ساختارهای معلوم برای داده‌های گم شده در تحلیل آماری موجب جلوگیری از نتایج اریب می شود.
– بی‌پاسخی جزئی
بی‌پاسخی جزئی به‌وسیله وابستگی زمانی مشخص می‌شود. پس از نقطه معینی از زمان همه داده‌ها گم شده‌اند. دو مثال معروف بی‌پاسخی جزئی عبارت‌اند از :
ریزش اعضای گروه یا ترک گروه