پایان نامه رایگان با موضوع سلسله مراتب، سلسله مراتبی، بخش بندی مشتریان

رفتار مشتری استفاده می‌شود. در این پژوهش نیز برای سنجش ارزش رفتاری مشتریان از سه شاخص مذکور و همچنین از شبکه خود سازمانده برای بخش‌بندی در سه مدل طراحی شده استفاده می‌شود. به دلیل استفاده از شبکه خود سازمانده همه متغیرهای اسمی و عددی به بازه صفر و یک منتقل می‌شوند. برای تبدیل متغیرهای اسمی به متغیرهای عددی از کدگذاری 1 از 1-N استفاده می‌کنیم که این کار باعث انتقال این متغیرها به بازه صفر و یک می‌شود. برای انتقال متغیرهای عددی به بازه صفر و یک از فرمول 3-2 استفاده می‌کنیم.
(3-2)
در این تحقیق به ارائه یک متدولوژی جامع شامل سه مدل دو مرحله‌ای برای بخش‌بندی مشتریان بر اساس ارزش آنها می‌پردازیم. در این متدولوژی از دو پایگاه داده، شامل پروفایل شخصی مشتریان158 و داده‌های معاملاتی159 و استفاده می‌نماییم که در شکل 3-1 نشان داده شده است.
شکل3-1 متدولوژی تحقیق
شکل‌های 3-2، 3-3 و 3-4 مدل‌های توسعه داده شده را در این متدولوژی بیان می‌کند.
در مدل اول از این متدولوژی، ابتدا بخش‌بندی را بر اساس داده‌های جمعیت‌شناختی160 از پروفایل مشتریان با استفاده از شبکه عصبی خود سازمانده161 انجام می‌دهیم، سپس به بخش‌بندی دوباره هر کدام از بخش‌های نتیجه گرفته شده از مرحله اول بر اساس داده‌های معاملاتی با استفاده از ابزارهای داده‌کاوی RFM و K میانگین می‌پردازیم در این مرحله K بهینه را از شاخص دیویس بولدین به دست می‌آوریم. در نهایت بخش‌های بدست آمده را بر اساس ارزششان رتبه‌بندی می‌کنیم.
شکل 32 اولین مدل توسعه داده شده جهت بخش بندی مشتریان بر اساس ارزش آنها
در مدل دوم از این متدولوژی، ابتدا مشتریان را بر اساس داده‌های معاملاتی (RFM وزن‌دار) با استفاده از الگوریتم K میانگین بخش‌بندی می‌نماییم، در این روش مقدار K بهینه از قبل توسط شاخص دیویس بولدین تعیین می‌شود. سپس هر بخش به دست آمده از مرحله اول را بر اساس داده‌های جمعیت‌شناختی با استفاده از شبکه عصبی خود سازمانده دوباره بخش‌بندی می‌نماییم و در نهایت بخش‌های بدست آمده را بر اساس ارزششان رتبه‌بندی می‌کنیم.
شکل 33 دومین مدل توسعه داده شده جهت بخش بندی مشتریان بر اساس ارزش آنها
در مدل سوم از این متدولوژی، ابتدا مشتریان را با استفاده از شبکه عصبی خود سازمانده، بر اساس متغیرهای جمعیت‌شناختی و متغیرهای تراکنشی (RFM وزن‌دار) بخش‌بندی نموده سپس از تعداد خوشه‌ی بدست آمده (k) و مراکز خوشه‌ها به عنوان ورودی روش K میانگین برای بخش‌بندی دوباره مشتریان بر اساس متغیرهای جمعیت‌شناختی و تراکنشی استفاده می‌نماییم و در نهایت بخش‌های بدست آمده را بر اساس ارزششان رتبه‌بندی می‌کنیم.
شکل 3-4 سومین مدل توسعه داده شده جهت بخش بندی مشتریان بر اساس ارزش آنها
3-5 ارزیابی اعتبار مدل
برای ارزیابی اعتبار مدل از شاخص دیویس بولدین و مجموع مربعات خطا162 استفاده شده است.
شاخص دیویس بولدین معیاری برای سنجش کیفیت الگوریتم های خوشه‌بندی است که اولین بار توسط دیویس و بولدین در سال 1979 ارائه شد (سید حسینی و همکاران، 2010). این معیار از شباهت بین دو خوشه استفاده می‌کند که بر اساس  پراکندگی  یک خوشه () و عدم شباهت بین دو خوشه () تعریف می‌شود. شباهت بین دو خوشه را می‌توان به صورتهای مختلفی تعریف کرد ولی بایستی شرایط زیر را دارا باشد.
اگر و هر دو برابر صفر باشند آنگاه نیز برابر صفر باشد.
اگر  و  آنگاه
اگر  و آنگاه
معمولا شباهت بین دو خوشه به صورت زیر تعریف می‌شود:
(3-2)
که در آن و با روابط زیر محاسبه می‌شوند.
(3-3)
(3-4)
با توجه به مطالب بیان شده و تعریف شباهت بین دو خوشه شاخص دیویس بولدین به صورت زیر تعریف می‌شود.
(3-5)
که در آن به صورت زیر محاسبه می‌شود.
(3-6)
 
این شاخص در واقع میانگین شباهت بین هر خوشه با شبیه‌ترین خوشه به آن را محاسبه می‌کند. می‌توان دریافت که هرچه مقدار این شاخص کمتر باشد، خوشه‌های بهتری تولید شده است (میرزاییان، 1391).
شاخص مجموع مربعات خطا را نیز برای ارزیابی و مقایسه کیفیت سه مدل بخش‌بندی استفاده شده است. این شاخص به صودت زیر محاسبه می‌شود (هوانگ و کچادی، 2013):
(3-7)
داریم:
: تعداد داده‌ها در خوشه‌ی
oij: jامین داده از خوشه‌ی
همانطور که ملاحظه می‌شود این معیار تنها شباهت درون خوشه‌ای را در نظر می‌گیرد و هرچه این مقدار کمتر باشد کیفیت خوشه‌بندی بهتر است.
در نهایت جامع‌ترین مدل را با الگوریتم معروف K میانگین بنا بر دو معیار بیان شده مقایسه می‌نماییم.
فصل 4:
تجزیه و تحلیل داده‌ها
(پیاده‌سازی مدل در مرکز اپل ایران)
فصل 4: تجزیه و تحلیل داده‌ها (پیاده‌سازی مدل در مرکز اپل ایران)
4-1 مقدمه
در این فصل ابتدا به معرفی داده‌های مورد استفاده در مدل‌ها می‌پردازیم. سپس روش‌های ابتکاری، تجزیه و تحلیل داده‌‌ها و بخش‌بندی مشتریان بر اساس ارزش آنها در مدل‌ها بررسی می‌گردد، همچنین مراحل و نتایج عددی حاصل از پیاده‌سازی مدل در مرکز اپل ایران تشرح می‌گردد.
4-2 درک و شناخت داده‌ها
داده‌های مورد استفاده در این تحقیق مربوط به فروشگاه‌های زنجیره‌ای مرکز اپل ایران است که دارای شعب متعدد می‌باشد. داده‌ها توصیف‌کننده‌ی تراکنش‌های انجام شده توسط مشتریان این فروشگاه زنجیره‌ای از ماه ژانویه‌ تا دسامبر سال 2012 یعنی 12 ماه می‌باشند. به دلیل محدودیت در پرسیدن داده‌های جمعیت‌شناختی مشتریان، در نهایت سه مشخصه از آنها مورد بررسی قرار گرفت. مشخصه‌های اسمی شامل جنسیت و تحصیلات، و مشخصه‌ی عددی شامل سن می‌باشد. طیف سنی 347 مشتری نمونه‌گیری شده، از 11 سال تا 70 سال می‌باشد، که با فرمول 4-1 به بازه صفر و یک منتقل شده‌اند.
(4-1)
نتایج جدول و شکل 4-1 نشان می‌دهدکه از 347 نفر گروه نمونه، 89 نفر (26 درصد) دارای تحصیلات دیپلم و زیر دیپلم، 180 نفر (52 درصد) دارای تحصیلات لیسانس و فوق دیپلم، 61 نفر (17 درصد) دارای تحصیلات فوق لیسانس و 17 نفر (5 درصد) دارای تحصیلات دکتری هستند.
جدول 4-1 فراوانی و درصد فراوانی گروه نمونه بر حسب سطح تحصیلات
سطح تحصیلات
فراوانی
درصد فراوانی
دیپلم و زیر دیپلم
89
26
لیسانس و فوق دیپلم
180
52
فوق لیسانس
61
17
دکترا
17
5
جمع کل
347
100
شکل 4-1 نمودار فراوانی گروه نمونه بر حسب سطح تحصیلات
نتایج جدول و شکل 4-2 نشان می‌دهد که از حجم 347 نفر گروه نمونه، 266 نفر (77 درصد) مرد و 81 نفر (23 درصد) زن هستند.
جدول 4-2 فراوانی و درصد فراوانی گروه نمونه بر حسب جنسیت
جنسیت
فراوانی
درصد فراوانی
مرد
266
77
زن
81
23
جمع کل
347
100
شکل 4-2 نمودار فراوانی گروه نمونه بر حسب جنسیت
داده‌های تراکنشی مشتریان نیز شامل مشخصه‌های عددی تأخر، تناوب و ارزش پولی هر مشتری می‌باشد. که البته چون این پارامترها در مکان‌های تجاری مختلف وزن متفاوتی دارند به روش AHP و با نظر خبرگان مرکز اپل ایران، آنها را وزن‌دار کرده‌ایم.
4-3 آماده‌سازی داده‌ها
همانطور که در فصل قبل بیان شد، رکوردهایی که داده‌های غایب داشتند برای پاک‌سازی داده‌ها حذف شدند. داده‌های این تحقیق شامل دو دسته داده‌های تراکنشی و داده‌های شخصی است. این داده‌ها را نرمالیزه (استاندارد) می‌نماییم تا در یک طیف مشابه قرار گیرند.
برای نرمالیزه کردن متغیرهای F و M از فرمول 4-2 استفاده می‌گردد:
(4-2)
برای متغیر R از فرمول‌ 4-3 برای نرمالیزه کردن استفاده می‌گردد:
(4-3)
که در فرمول‌های ذکر شده داریم:
: بزرگترین مقدار
: کوچک‌ترین مقدار
با استفاده از فرمول‌های بالا نرم مقادیر متغیرهای R و Fو M محاسبه می‌شوند. پس از نرمالایز کردن تناوب، تاخر و ارزش پولی مشتریان این مقادیر دربازه صفر تا یک قرار می‌گیرند.
در مورد داده‌های شخصی نیز چون اعداد ورودی به شبکه‌های عصبی باید کوچک باشند، داده‌ها را به بازه صفر و یک انتقال می‌دهیم. پس قبل از آموزش شبکه خود سازمانده، کلیه متغیرها اعم از عددی و اسمی به این بازه نگاشته شده‌اند. در این تحقیق برای تبدیل متغیرهای اسمی به متغیرهای عددی، از رویکرد کدگذاری 1 از 1-N استفاده شده است. این عمل باعث افزایش تعداد متغیرها می‌شود زیرا به تعداد مقادیر هر متغیر اسمی منهای یک، متغیر تولید می‌شود. به این ترتیب متغیرهای جمعیت‌شناختی مورد بررسی ما از 3 به 5 افزایش می‌یابد (جدول4-4). به عنوان مثال برای تبدیل متغیر اسمی به متغیر عددی، به این ترتیب عمل نمودیم که متغیر تحصیلات را با سه متغیر دیپلم و زیر دیپلم، لیسانس و فوق دیپلم، فوق لیسانس جایگزین نمودیم اگر مشتری تحصیلاتش دیپلم و زیر دیپلم باشد، مقدار متغیر دیپلم و زیر دیپلم معادل 1، لیسانس و فوق دیپلم معادل صفر و فوق لیسانس نیز معادل صفر خواهد شد. همچنین اگر مشتری تحصیلاتش دکتری باشد هر سه متغیر معادل صفر می‌شوند. به این ترتیب همه متغیرهای اسمی به عددی تبدیل شدند. چگونگی این تبدیل‌ها در جدول 4-3 آمده است.
جدول 4-3 تبدیل متغیر اسمی تحصیلات به متغیر عددی با استفاده از کدگذاری 1 از 1-N
کدگذاری 1 از 1-N
تحصیلات
دیپلم و زیر دیپلم
لیسانس و فوق دیپلم
فوق لیسانس
دیپلم و زیر دیپلم
1
لیسانس و فوق دیپلم
1
فوق لیسانس
1
دکتری
جدول4-4 متغیرها بعد از کدگذاری 1 از 1-N
شماره متغیر
نام متغیر
1
جنسیت-مرد
2
سن
3
دیپلم و زیر دیپلم
4
لیسانس و فوق دیپلم
5
فوق لیسانس
4-4 تعیین وزن پارامترهای تراکنشی (RFM) با استفاده از فرآیند تحلیل سلسله مراتبی
ضریب اهمیت (وزن) شاخص‌ها در مکان‌های تجاری مختلف یکسان نیستند. بعضی شاخص‌ها بر شاخص‌های دیگر ارجعیت بیشتر یا کمتری دارند. روش‌های مختلفی مانند روش آنتروپی، بردار ویژه، روش اسمارت، روش تحلیل سلسله مراتبی163 برای تعیین وزن شاخص‌ها وجود دارد. متداول‌ترین روش برای محاسبه‌ی وزن متغیرهای مدل RFM طبق ادبیات، تکنیک تحلیل سلسله مراتبی می‌باشد. روش AHP یک تکنیک قوی و یک ابزار انعطاف‌پذیر و چند معیاره به منظور تصمیم‌گیری در مسائل پیچیده است که دو مفهوم کیفی و کمی را مدنظر قرار می‌دهد (برتولینی164 و همکاران، 2006).
این تکنیک با انجام مقایسات دو به دو بین عناصر تصمیم و از طریق تخصیص امتیاز عددی که نشان دهنده ارجحیت یا اهمیت بین دو عنصر تصمیم می‌باشد، صورت می‌گیرد. در جدول 4-5 نحوه‌ی ارزش‌گذاری شاخص‌ها نسبت به هم نشان داده شده است.
جدول 45 جدول امتیازدهی به شاخص های i وj نسبت به یکدیگر در تکنیک AHP
ارزش ترجیحی
وضعیت مقایسه i نسبت به j
توضیحات
1
اهمیت برابر
گزینه یا شاخص i نسبت به j اهمیت برابر دارند و یا ارجحیتی نسبت به هم ندارند.
3
نسبتا مهم تر
گزینه یا شاخص iنسبت به j کمی مهم تر است.
5
مهم تر
تجربیات و یا قضاوت ها نشان می دهد که i نسبت به j مهم تر است.
7
خیلی مهم تر
گزینه یا شاخص i دارای ارجحیت زیاد و خیلی مهم تر از j است.
9
بی نهایت مهم تر
گزینه ویا شاخص i مطلقا از j بی نهایت مهم تر است.
2و4و6و8
ارزش های میانی
ارزش های میانی بین ارزش های ترجیحی را نشان می دهد مثلا 8 بیانگر اهمیتی زیادتر از 7 و پایین تر از 9 برای i است.
در فرآیند تحلیل سلسله مراتبی تقریبا تمامی محاسبات مربوطه بر

مطلب مشابه :  مقاله درمورد دانلوددانش آموز، دانش آموزان، پیشرفت تحصیلی