تحقیق درباره افشای اطلاعات و روشهای درمان

دانلود پایان نامه

(4-13)
(4-13)

برای تقریب به مود، گری بیل و بوس (1986) مراجعه کنید.
با توجه به روابط (4-12) و (4-13)، داریم
(4-14)


(4-14)

مقدار اریبی را می توان به صورت زیر محاسبه کرد
(4-15)
قضیه 4-3. واریانس برابر است با

4-5 خلاصه و نتیجه‌گیری‌
در این فصل دیدیم که درصورت وجودبی پاسخی می توان اریبی وافزایش واریانس حاصل ازاین بی پاسخی را با افزودن برتعداد نمونه اولیه کاهش داد.یعنی برای رسیدن به دقت معلومی می توان درابتدای کار تعداد نمونه را چنان بزرگ انتخاب کرد که با وجود داشتن تعدادی بی پاسخی به دقت موردنظر دست یافت . چنین کاری را با کاهش اریبی و کاهش واریانس نمونه گیری انجام می دهیم . برای تعیین تعداد بهینه مراجعات مکرر و تصحیح اندازه نمونه اصلی از ابزار مهم و کاربردی جذر MSE که در واقع خطای برآوردگر است، استفاده شد که معادلات مربوط به اریبی و واریانس حاصل از ترکیب مراحل جمعآوری اطلاعات از نمونه اصلی، به دست آمد.
5-1 مقدمه
بی‌پاسخی مشکلی است که در داده‌های نمونه‌گیری مکرراً اتفاق می‌افتد. هرچند که نمی‌توان آن را کاملاً از بین برد، اما تا حد زیادی می‌توان کاهش داد. این کار باعث می‌شود که نه‌تنها داده‌های بیشتری را برای استفاده در تحلیل‌ها دراختیار پژوهشگران بگذارد بلکه اطلاعات کمکی برای جانهی و تعدیل بهتر فراهم می‌سازد. در معامله با داده‌های گم شده، درک، پیشگیری، و جانهی با هم مرتبط‌‌‌اند. برای ارائه ابزارهای کافی به پژوهشگرانی که از داده‌های نمونه‌گیری استفاده می‌کنند، همه این جنبه‌ها را مرور می‌کنیم. ابتدا، یک گونه‌شناسی از الگوهای داده‌های گم شده و منشاء آنها را عرضه می‌کنیم.
بر پایه این گونه‌شناسی و منشاء بالقوه بی‌پاسخی سؤال، طرحی کلی را برای اینکه چگونه می‌توان تا حد امکان از داده‌های گم شده پیشگیری کرد ارائه می‌کنیم. در پایان بحث می‌کنیم که چگونه آگاهی از فرایند گردآوری داده‌ها می‌تواند بررسی آماری داده‌های گم شده باقیمانده را بهبود بخشد.
شاخصی مهم از کیفیت داده‌های نمونه‌گیری میزان داده‌های گم شده مربوط به سؤال‌هاست. وقتی بی‌پاسخی سؤال رخ می‌دهد، یک واحد آمارگیری (مثلاً، یک شخص) داده‌هایی را دراختیار می‌گذارد اما به دلیلی داده‌های مربوط به سؤال‌ها یا اقلام خاص پرسشنامه برای تحلیل در دسترس نیستند. زمان‌هایی نه چندان دور، پژوهشگران این مشکل را با نادیده گرفتن آن و محدود ساختن تحلیل به مقادیر مشاهده شده، یا موارد کامل حل کرده‌ بودند. اما، این کار باعث از دست رفتن اطلاعات می‌شود؛ برآوردها کارآیی کمتری خواهند داشت، و آزمونهای آماری توان کمتری خواهند داشت. با در دسترس قرار گرفتن نرم‌افزارهایی که کار با آنها آسان است و به‌طور مداوم تولید می‌شوند استفاده از دو روش جانهی و برآورد مستقیم افزایش خواهد یافت. پیش‌نیاز بررسی آماری داده‌های گم شده آن است که درباره اینکه داده‌های گم شده چگونه و چرا رخ داده‌اند بیشتر بدانیم. مثلاً، مقدار گم شده‌ای که از فراموش کردن کاملاً تصادفی یک سؤال ناشی می‌شود با مقدار گم شده‌ای که از بی‌رغبتی یک پاسخگو به افشای اطلاعات حساس ناشی می‌شود (بیپاسخی) کاملاً تفاوت دارد. نوع اول گم شدگی را می‌توان به عنوان گم شدگی کاملاً تصادفی انگاشت، نوع دوم گم شدگی تصادفی نیست و روشهای پیچیده‌تری را لازم دارد که شامل مدلی برای گم شدگی است. بدین ترتیب، پژوهشگران خود را در موضع ” دور تسلسل “ می‌یابند : باید درباره داده‌های گم شده بیشتر دانست تا بهترین روش را برای رفتار با داده‌های گم شده انتخاب کرد. بنابراین، پیشگیری گام نخست لازم برای رویارویی با داده‌های گم شده است. کاهش بی‌پاسخی سؤال به جانهی کمتر در مجموعه داده‌ها، به داده‌های بیشتر برای بررسی الگوهای بی‌پاسخی سؤال و انتخاب بهترین درمان و سرانجام به داده‌های بیشتر برای
بنا نهادن یک جانهی صحیح بر آنها، منجر خواهد شد. معامله موفقیت‌آمیز با بی‌پاسخی سؤال مستلزم تلاش و همکاری توأم ” کاهش‌دهندگان“ و ”تعدیل‌کنندگان“ است!
در این فصل داده‌های گم شده در آمارگیری‌های نمونه‌ای بحث می‌شود. هدف ما آن است که آمارشناسان نمونه‌گیری را که بر تعدیل آماری توجه دارند به تأکید بر درک بهتر از بی‌پاسخی سؤال و درمان آن متوجه سازیم. در بخش 2 با تعریف اشکال مختلف داده‌های گم شده شروع می‌کنیم. بر پایه این گونه‌شناسی، معرف‌های داده‌های گم شده در بخش 3 از هم تمیز داده شده و پیامدهای مربوط به بررسی آماری بحث می‌شوند. همچنین با شناختن معرف‌ها می‌توان اقدامات لازم برای پیشگیری از بی‌پاسخی را انجام داد و این موضوع در بخش 4 بررسی می‌شود. در بخش 5 نیز روشهای درمان
بیپاسخی مورد بررسی قرار میگیرد. موضوع را با نتیجهگیری از مطالب این فصل در بخش 6 به پایان می‌بریم.