مثبت
منفی
مثبت اشتباه
منفی
واقعی
منفی اشتباه
مثبت
عناصر روی قطر فرعی این ماتریس، مقادیر منفی اشتباه و مثبت اشتباه را نشان می دهد. نرخ خطای کلی از
حاصل جمع این دو مقدار خطا بر کل تعداد رکورد ها به دست می آید:
نرخ خطا = ( مثبت استباه + منفی اشتباه ) / تعداد کل رکورد ها [۳۸]
نمودار های Lift و Gain :
نمودار های lift و gain، متد های اعتبار سنجی گرافیکی از تخمین و مقایسه کارایی مدل های دسته بندی هستند. Lift مفهومی از حوزه بازاریابی است که به مقایسه نرخ پاسخ مشتریان، با و بدون استفاده از یک مدل
دسته بندی اختصاص دارد. به عنوان مثال فرض کنید متغیر میزان توصیه به دیگران مبنای دسته بندی مشتریان رویگردان باشد که مقدار صفر آن به عنوان رویگردانی و مقدار یک آن به عنوان عدم رویگردانی فرض شود. حال نرخ lift برای این درخت با عمق یک به صورت زیر محاسبه می شود:
Lift = نرخ رویگردانی در میان مشتریانی که میزان توصیه به دیگران آنها صفر است / نرخ رویگردانی کل مشتریان
Lift تابعی از اندازه نمونه است. زمانی که Lift محاسبه می شود، نرم افزار ابتدا رکورد ها را بر اساس احتمال اینکه آنها به عنوان مثبت دسته بندی شوند، مرتب می کند. پس از آن lift به ازای درصد مختلف اندازه نمونه با این ترتیب رسم می شود. مقادیر این نرخ ار چپ به راست کاهش یافته و در ۱۰۰% اندازه نمونه به مقدار یک می رسد. هرجه این نرخ بالاتر باشد بیانگر دقت بهتر مدل دسته بندی است. به طور شهودی نرخ چگالی در ۱۰% بالای جامعه بایستی بیشتر از دو برابر این نرخ در کل جامعه باشد. [۳۹] نمودار های lift معمولا در شکل تجمعی نشان داده می شوند که اصطلاحا به این فرم نمودار gain گفته می شود. خط قطری کشیده شده در نمودار gain برابر با محور افقی lift=1 در نمودار lift است. معمولا نمودار های gain به آرامی از این خط قطری فاصله گرفته و نموداری منحنی شکل را در بالای قطر اصلی تا رسیدن دوباره به آن طی می کنند. نمودار های Lift و gain معمولا به صورت گسترده ای برای مقایسه عملکرد و کارایی مدل ها به کار می رود. [۳۸]
نمودار ROC:
معیار ROC بر اساس مقایسه کلاس پیش بینی شده با کلاس واقعی کار می کند. در واقع ROC عملکرد یک کلاس مشخص را با در نظر گرفتن رنجی از حد آستانه ممکن بررسی می کند. بر این اساس چهار پارامتر زیر تعریف می شوند:
TP: تعداد عناصر مثبتی که به درستی تعریف شده اند. (مثبت درست)
FP: تعداد عناصر منفی که به اشتباه به عنوان مثبت کلاس بندی شده اند. (مثبت اشتباه)
FN: تعداد عناصر مثبتی که به اشتباه به عنوان منفی کلاس بندی شده اند. (منفی اشتباه)
TN: تعداد عناصر منفی که به درستی منفی پیش بینی شده اند. (منفی درست)
دو شاخص حساسیت[۷۷] و تشخیص[۷۸] بر اساس این پارامتر ها تعریف می شوند:
این دو شاخص به ترتیب بیانگر دقت مدل در تشخیص مقادیر مثبت و منفی هستند. به عنوان مثال نرخ حساسیت بیانگر آن است که جند درصد از اعضای واقعا مثبت توسط مدل پیش بینی کننده شناسایی شده اند. این مقادیر وقتی که حد آستانه تغییر می کند تغییر می یابند. منحنی ROC یک نمودار دو بعدی از حساسیت بر حسب ۱- تشخیص است. این معیار برای بررسی عملکرد یک سیستم کلاس بندی باینری و مقایسه مدل های مختلف بر این اساس به کار می رود. [۳۸]
۶٫۲٫۳ . استقرار
در این مرحله سود حاصل از سرمایه گذاری انجام شده در مراحل قبلی به دست می آید. تمرکز این فاز روی یکپارچه سازی دانش در فرایند های کاری کسب و کار به گونه ای است که مسائل اساسی کسب و کار حل شوند. این مرحله شامل فعالیت های زیر می باشد:
اجرای برنامه
در این مرحله با بهره گرفتن از نتایج حاصل از فاز ارزیابی، استراتژی مناسب برای برای استقرار برنامه ریزی می شود.
خروجی این فاز:
برنامه اجرا[۷۹]: خلاصه ای از فعالیت های انجام شده در این مرحله، در این سند مشخص می شود.
آماده سازی گزارش نهایی
در این مرحله بر اساس نتایج برنامه اجرا در بخش قبل، گزارش نهایی پروژه ایجاد می شود. این گزارش ممکن است شامل خلاصه ای از روند اجرای پروژه و تجربیات به دست آمده یا گزارش جامعی ار نتایج داده کاوی باشد.
شکل شماره ۱٫۶٫۲٫۳٫ مرحله استقرار
ذکر این نکته ضروری است که هر سازمان بسته به زیرساخت های خود بر روی تعدادی از مراحل و زیرمرحله ها تمرکز بیشتری داشته باشد. در نتیجه مرور فرایند بالا مشخص شد که آنالیز داده ها تنها مجموعه ای از تکنیک ها و روش های محاسباتی و ریاضی نیست. بلکه یک فرایند منسجم و یکپارچه بوده که با شناسایی اهداف و نیازهای فضای کسب و کار - فاز اول- آغاز می شود. سپس به تناسب نیازهای مورد نظر، داده ها جمع آوری و آماده سازی - فازهای دوم و سوم - می شوند. سپس آنالیز روی داده ها بسته به کاربردهای مورد نظر - فاز چهارم- انجام می گردد. در فاز پنجم نتایج آنالیزهای انجام شده مورد ارزیابی و اعتبارسنجی قرار می گیرند. در نهایت در فاز ششم، دانش و نتایج بدست آمده در فرایند های کسب و کار جهت بهبود و نیل به اهداف فاز اول به کار گرفته می شود.
۳٫۳ . سرانجام فصل
با توجه به مرور ادبیات موضوع رویگردانی مشتری در فصل دوم، در این فصل مراحل روش پیشنهادی مورد استفاده در این تحقیق به صورت عام بیان شد. در ابتدا شیوه طراحی و جمع آوری داده ها و مرحله آماده سازی شامل پاک سازی و نرمال سازی داده ها بیان شده و در ادامه با مروری بر کاربرد های روش های مختلف داده کاوی در برسی رویگردانی مشتری اقدام به مقایسه آنها از جنبه های گوناگون شده است. سپس به بیان روش های اعتبار سنجی مدل به دست آمده پرداخته شد. در طی فصل آتی رویکرد مورد استفاده در این تحقیق، دلایل استفاده از آن، جزئیات فرایند اجرای تحقیق و شیوه اعتبار سنجی مورد استفاده به تفضیل شرح خواهد شد.
فصل چهارم : معماری مدل رویگردانی
۱٫۴٫ سرآغاز فصل
هر سازمان به طور عام و شرکت پخش و توزیع ارومیه به عنوان یکی از شرکت های تابع گروه صنایع غذایی سولیکو به طور خاص، به مشتریان خود وابسته است و باید نیازهای حال و آینده آنان را درک نماید و نیازمندیهای مشتریان خود را برآورده سازد. علاوه بر این سازمان باید برای عبور از انتظارات مشتریان خود و حفظ موقعیت خود در بازار رقابتی امروز، برنامه ریزی و تلاش نماید. تمرکز بر مشتری و درک نیازهای او باعث پاسخگویی منعطف و سریع سازمان به فرصتهای بازار و در نتیجه افزایش سود سهام و سهم بازار برای سازمان خواهد شد. در نتیجه رضایت مشتریان با افزایش اثر بخشی به
فرم در حال بارگذاری ...