پایان نامه با کلید واژه های شخص ثالث

تقديم به
همسرمهربان و فداکارم
که در تمام مراحل زندگي، يار و ياورم بوده اند و مرا در سخت ترين شرايط تحصيل علم ذره اي تنها نگذاشته اند و مدام طي کردن پله هاي ترقي را برايم آسان نموده است.
تقديم به مادرم
که هميشه خواستار سلامتي و مشتاق ديدن پيشرفت هاي فرزندانش بوده است. تقديم به پدرم، خواهرانم و برادرانم که هميشه مشوق و مهيا کننده شرايط تحصيلم بوده اند.
اين نوشتار حاصل تلاشي برگرفته از قلوب پرمهر و عطوفت شما بوده است و اکنون به عنوان دارايي معنوي و علمي ام هرچند که درمقابل وسعت روح شما ناچيز است به شما تقديم مي گردد.
سپاسگزاري
اکنون که اين رساله با توفيقات خداوند متعال به پايان رسيده است از استاد ارجمند جناب آقاي دکتر غلامحسين دستغيبي فرد که با راهنمايي هاي متعهدانه مرا در انجام اين رساله ياري نموده اند کمال تشکر را دارم. همچنين از اساتيد محترم جناب آقاي دکتر اشکان سامي و جناب آقاي دکتر سيدمصطفي فخراحمد که به عنوان اساتيد مشاور و داور اين رساله ازمساعدت ايشان بهره مند بوده ام صميمانه تشکر و قدرداني مي نمايم. همچنين از رياست اداره آمار و اتکايي شرکت سهامي بيمه ايران جناب آقاي محمد حضرتي اسطلخ کوهي که با در اختيار قراردادن امکانات لازم اينجانب را در انجام اين تحقيق ياري نموده اند و آقاي مهندس بابک فولادي نيا که درانجام بخش هاي عملي پايان نامه و نگارش اين رساله مشاورات فراواني را به اينجانب ارائه کرده اند نيز قدرداني مي نمايم.
چکيده
ارائه مدلي براي شناسايي عوامل اثرگذار و ضريب تاثير آنها در سود و زيان بيمه شخص ثالث خودرو شرکتهاي بيمه بوسيله روشهاي داده کاوي
مطالعه موردي: شرکت سهامي بيمه ايران
به کوشش:
فرامرز کرمي زاده
بررسي اطلاعات بيمه هاي اتومبيل نشان داده عواملي چون نوع استفاده خودرو، داشتن گواهينامه رانندگي، نوع گواهينامه و تطابق يا عدم تطابق آن با وسيله نقليه، مبلغ حق بيمه، ميزان تعهدات بيمه نامه، کيفيت خودروي خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بيمه با مورد بيمه، تاخيردرتمديد بيمه نامه، در سود و زيان شرکت هاي بيمه تاثير داشته اند.
هدف اين پايان نامه شناخت عوامل اثرگذار و ضريب تاثير آنها در سود و زيان بيمه شخص ثالث خودرو شرکت هاي بيمه با استفاده از روش داده کاوي و سپس انتخاب الگوريتمي که بهترين ميزان دقت پيش بيني براي تشخيص اين عوامل را داشته اند مي باشد.
نتيجه حاصل از اين پژوهش نشان مي دهد که روشهاي داده کاوي با استفاده از الگوريتم هاي دسته بندي با دقت بالاي 91% و الگوريتم هاي درخت تصميم با دقت بالاي 96% و الگوريتم هاي خوشه بندي با ايجاد خوشه هاي قابل قبول قادر به ارائه مدلي براي تشخيص عوامل اثرگذار و تعيين ميزان اثر آنها در سود و زيان بيمه نامه شخص ثالث خودرو خواهند بود.
کليدواژگان: داده کاوي ـ بيمه شخص ثالث خودرو ـ سود و زيان
فهرست مطالب
عنوان صفحه
فصل اول: مقدمه
1-1 تعريف داده کاوي 3
1-2 تعريف بيمه 4
1-3 هدف پايان نامه 4
1-4 مراحل انجام تحقيق 4
1-5 ساختار پايان نامه 5
فصل دوم: ادبيات موضوع و تحقيقات پيشين
2-1 داده کاوي و يادگيري ماشين 7
2-2 ابزارها و تکنيک هاي داده کاوي 8
2-3 روشهاي داده کاوي 9
2-3-1 روشهاي توصيف داده ها 10
2-3-2 روشهاي تجزيه و تحليل وابستگي 10
2-3-3 روشهاي دسته بندي و پيشگويي 10
2-3-4 درخت تصميم 11
2-3-5 شبکه عصبي 12
2-3-6 استدلال مبتني بر حافظه 12
2-3-7 ماشين هاي بردار پشتيباني 13
2-3-8 روشهاي خوشه بندي 13
2-3-9 روش K-Means 13
2-3-10 شبکه کوهنن 14
2-3-11 روش دو گام 14
2-3-12 روشهاي تجزيه و تحليل نويز 14
2-4 دسته هاي نامتعادل]صنيعي آباده 1391[. 15
2-4-1 راهکار مبتني بر معيار 15
2-4-2 راهکار مبتني بر نمونه برداري 15
2-5 پيشينه تحقيق 16
2-6 خلاصه فصل 19
فصل سوم: شرح پژوهش
3-1 انتخاب نرم افزار 21
3-1-1 Rapidminer 21
3-1-2 مقايسه RapidMiner با ساير نرم افزار هاي مشابه 21
3-2 داده ها 25
3-2-1 انتخاب داده 25
3-2-2 فيلدهاي مجموعه داده صدور 25
3-2-3 کاهش ابعاد 25
3-2-4 فيلدهاي مجموعه داده خسارت 29
3-2-5 پاکسازي داده ها 29
3-2-6 رسيدگي به داده هاي از دست رفته 29
3-2-7 کشف داده دور افتاده 30
3-2-8 انبوهش داده 32
3-2-9 ايجاد ويژگي دسته 32
3-2-10 تبديل داده 32
3-2-11 انتقال داده به محيط داده کاوي 32
3-2-12 انواع داده تعيين شده 33
3-2-13 عمليات انتخاب ويژگيهاي موثرتر 34
3-3 نتايج اعمال الگوريتم PCA و الگوريتم هاي وزن دهي 34
3-4 ويژگي هاي منتخب جهت استفاده در الگوريتمهاي حساس به تعداد ويژگي 36
3-5 معيارهاي ارزيابي الگوريتمهاي دسته بندي 37
3-6 ماتريس درهم ريختگي 37
3-7 معيار AUC 38
3-8 روشهاي ارزيابي الگوريتم هاي دسته بندي 39
3-8-1 روش Holdout 39
3-8-2 روش Random Subsampling 39
3-8-3 روش Cross-Validation 40
3-8-4 روش Bootstrap 40
3-9 الگوريتمهاي دسته بندي 41
3-9-1 الگوريتم KNN 42
3-9-2 الگوريتم Naïve Bayes 42
3-9-3 الگوريتم Neural Network 43
3-9-4 الگوريتم SVM خطي 45
3-9-5 الگوريتم رگرسيون لجستيک 46
3-9-6 الگوريتم Meta Decision Tree 47
3-9-7 الگوريتم درخت Wj48 49
3-9-8 الگوريتم درخت Random forest 51
3-10 معيارهاي ارزيابي الگوريتم هاي مبتني بر قانون(کشف قوانين انجمني) 54
3-10-1 الگوريتم FPgrowth 55
3-10-2 الگوريتم Weka Apriori 55
3-11 معيارهاي ارزيابي الگوريتمهاي خوشه بندي 55
3-12 الگوريتم هاي خوشه بندي 57
3-12-1 الگوريتم K-Means 57
3-12-2 الگوريتم Kohonen 60
3-12-3 الگوريتم دوگامي 64
فصل چهارم: ارزيابي و نتيجه گيري
4-1 مقايسه نتايج 69
4-2 الگوريتمهاي دسته بندي 69
4-3 الگوريتم هاي دسته بندي درخت تصميم 70
4-4 الگوريتم هاي خوشه بندي 79
4-5 الگوريتم هاي قواعد تلازمي(مبتني بر قانون) 81
4-6 پيشنهادات به شرکت هاي بيمه 81
4-7 پيشنهادات جهت ادامه کار 83
منابع و مأخذ
فهرست منابع فارسي 84
فهرست منابع انگليسي 85
فهرست جدول‌ها
عنوان صفحه
جدول شماره 3-1: نتايج راي گيري استفاده از نرم افزارهاي داده کاوي 24
جدول شماره 3-2: فيلدهاي اوليه داده هاي صدور 26
جدول شماره 3-3: فيلدهاي نهايي داده هاي صدور 27
جدول شماره 3-4: فيلدهاي حذف شده داده هاي صدور و علت حذف آنها 28
جدول 3-5: فيلدهاي استخراج شده از داده هاي خسارت 28
جدول 3-6: نتايج نمودار boxplot 31
جدول 3-7: انواع داده استفاده شده 33
جدول 3-8: نتايج حاصل از اجتماع فيلدهاي با بالاترين وزن در الگوريتمهاي مختلف 37
جدول 3-9: ماتريس در هم ريختگي رکوردهاي تخميني(Predicted Records) 38
جدول 3-10: قوانين استخراج شده توسط الگوريتم Fpgrowth 55
جدول 3-11: قوانين استخراج شده توسط الگوريتم Weka Apriori 55
جدول 3-12: تنظيمات پارامترهاي الگوريتم K-Means 57
اجرا براي 9 خوشه در الگوريتم K-Means 60
جدول 3-13: تنظيمات پارامترهاي الگوريتم Kohonen 64
جدول 3-14: تنظيمات پارامترهاي الگوريتم دوگامي 69
جدول 4-1: مقايسه الگوريتم هاي دسته بند 70
جدول 4-2: مقايسه الگوريتم هاي دسته بند درخت تصميم 70
جدول 4-3: ماتريس آشفتگي قانون شماره 1 71
جدول 4-4: ماتريس آشفتگي قانون شماره 2 72
جدول 4-5: ماتريس آشفتگي قانون شماره 3 الف 72
جدول 4-6: ماتريس آشفتگي قانون شماره 3 ب 72
جدول 4-7: ماتريس آشفتگي قانون شماره 3 ج 73
عنوان صفحه
جدول 4-8: ماتريس آشفتگي قانون شماره 3 د 73
جدول 4-9: ماتريس آشفتگي قانون شماره 3 ه 73
جدول 4-10: ماتريس آشفتگي قانون شماره 3 و 74
جدول 4-11: ماتريس آشفتگي قانون شماره 3 ز 76
جدول 4-12: ماتريس آشفتگي قانون شماره 4 76
جدول 4-13: ماتريس آشفتگي قانون شماره 5 77
جدول 4-14: ماتريس آشفتگي قانون شماره 6 الف 77
جدول 4-15: ماتريس آشفتگي قانون شماره 6 ب 78
جدول 4-16: ماتريس آشفتگي قانون شماره7 78
جدول 4-17: ماتريس آشفتگي قانون شماره8 79
جدول 4-18: مقايسه الگوريتم هاي خوشه بندي 79
جدول 4-19: فيلدهاي حاصل از الگوريتم هاي خوشه بندي 80
جدول 4-20: نتايج الگوريتم هاي FpGrowth, Weka Apriori 81
فهرست شکل‌ها
عنوان صفحه
شکل شماره3-1: داده از دست رفته فيلد” نوع بيمه ” پس از انتقال به محيط داده کاوي 33
شکل 3-2: نتايج الگوريتمPCA 34
شکل 3-3: نتايج الگوريتم SVM Weighting در ارزشدهي به ويژگي ها 35
شکل 3-4: نتايج الگوريتم Weighting Deviation در ارزشدهي به ويژگي ها 35
شکل 3-5: نتايج الگوريتم Weighting Correlation در ارزشدهي به ويژگي ها 36
شکل 3-6: نماي کلي استفاده از روشهاي ارزيابي 41
شکل 3-7: نماي کلي استفاده از يک مدل درون يک روش ارزيابي 42
شکل 3-8: نمودار AUC الگوريتم KNN 42
شکل 3-9: نمودار AUC الگوريتم Naïve Bayes 43
شکل 3-10: تبديل ويژگي هاي غير عددي به عدد در الگوريتم شبکه عصبي 44
شکل 3-11: نمودار AUC و ماتريس آشفتگي الگوريتم Neural Net 44
شکل 3-12: تبديل ويژگي هاي غير عددي به عدد در الگوريتم SVM خطي 45
شکل 3-13 : نمودار AUC الگوريتم SVM Linear 46
شکل 3-14 : نمودار AUC الگوريتم رگرسيون لجستيک 47
شکل 3-15 : نمودار AUC الگوريتم Meta Decision Tree 48
شکل 3-16 : قسمتي از نمودارtree الگوريتم Meta Decision Tree 49
شکل 3-17 : نمودار radial الگوريتم Meta Decision Tree 49
شکل 3-18: نمودار AUC الگوريتم Wj48 50
شکل 3-19 : نمودار tree الگوريتم Wj48 51
شکل 3-20 : نمودار AUC الگوريتم Random forest 52
شکل 3-21 : نمودار توليد 20 درخت در الگوريتم Random Forest 53
شکل 3-22 : يک نمونه درخت توليد شده توسط الگوريتم Random Forest 53
عنوان صفحه
شکل 3-23 : رسيدن درصد خطا به صفر پس از 8مرتبه 57
شکل 3-24 : Predictor Importance for K-Means 58
شکل 3-25 : اندازه خوشه ها و نسبت کوچکترين خوشه به بزرگترين خوشه در الگوريتم
K-Means 59
شکل 3-26 : کيفيت خوشه ها در الگوريتمMeans K- 60
شکل 3-27 : Predictor Importance for Kohonen 61
شکل 3-28 : اندازه خوشه ها و نسبت کوچکترين خوشه به بزرگترين خوشه در الگوريتم
Kohonen 62
شکل 3-29 : کيفيت خوشه ها در الگوريتمMeans K- 63
شکل 3-30 : تعداد نرون هاي ورودي و خروجي در Kohonen 63
شکل 3-31 : Predictor Importance for دوگامي 64
شکل 3-32 : اندازه خوشه ها و نسبت کوچکترين خوشه به بزرگترين خوشه در
الگوريتم دوگامي 65
شکل 3-33 : کيفيت خوشه ها در الگوريتم دوگامي 66
شکل4-1: نمودارنسبت تخفيف عدم خسارت به خسارت 75
فصل اول
مقدمه
شرکتهاي تجاري و بازرگاني براي ادامه بقا و حفظ بازار همواره بر سود دهي و کاهش ضرر و زيان خود تاکيد دارند از اين رو روشهاي جذب مشتري و همچنين تکنيکهاي جلوگيري يا کاهش زيان در سرلوحه کاري اين شرکتها قرار مي گيرد.
از جمله شرکتهايي که بدلايل مختلف در معرض کاهش سود و يا افزايش زيان قرار مي گيرند شرکتهاي بيمه اي مي باشند. عواملي همچون بازاريابي، وفاداري مشتريان، نرخ حق بيمه، تبليغات، تقلب، مي تواند باعث جذب يا دفع مشتري گردد که در سود و زيان تاثير مستقيم و غير مستقيم دارد.
پرداخت

دیدگاهتان را بنویسید

Close Menu