دانشگاه علامه طباطبايي
دانشکده مديريت و حسابداري
پايان نامه کارشناسي ارشد رشته مديريت امور شهري
کاربرد داده کاوي در کشف دانش پنهان ميان داده هاي سامانه 137 شهرداري تهران
استاد راهنما
دکتر جمال شهرابي
استاد مشاور
دکتر غلامرضا کاظميان
پژوهشگر
مينا گشادرو
زمستان 1390
تقديم به مادرم
آن که از نگاهش صلابت،
از رفتارش محبت
و از صبرش ايستادگي را آموختم…
به رسم ادب و احترام برخود لازم مي دانم، زحمات کليه اساتيد گرانقدرم را ارج نهاده و مراتب تشکر و سپاسگزاري قلبي خويش را از الطاف ايشان ابراز دارم.
از جناب آقاي دکتر شهرابي استاد راهنماي گرامي که با راهنمايي هاي ارزنده و حمايت هاي
هميشگي شان نقش چشمگيري در به ثمر رسيدن اين تحقيق داشته اند صميمانه تشکر مي کنم.
از جناب آقاي دکتر کاظميان استاد مشاور گرامي به خاطر مساعدت ها و هم فکري هاي بي دريغشان سپاسگزارم. بي شک انجام اين پژوهش بدون همکاري و همدلي اين اساتيد غير ممکن مي نمود.
هم چنين از جناب آقاي مهندس مجيدي مدير فني مرکز سامانه مديريت شهري 137 و جناب آقاي فرهند معاون فرهنگي-اجتماعي شهرداري تهران به خاطر همکاري هاي صميمانه شان در دريافت اطلاعات مورد نياز و نيز از جناب آقاي مهندس هداوندي که با راهنمايي هاي ارزنده خود سهم بسزايي در پيشرفت کار داشتند تشکر مي نمايم.
در پايان از خانواده ي مهربانم به ويژه خواهرم به خاطر صبوري، بردباري و حمايت هاي دلسوزانه شان سپاسگزارم.
پبامبر اکرم (ص):
دانش اگر در ثريا هم باشد مردماني از سرزمين پارس بدان دست خواهند يافت.
چکيده
شهرداري يکي از کليدي ترين سازمان هايي است که در ارائه ي خدمات شهري به شهروندان نقش مهمي ايفا مي کند. اين سازمان با به کار بستن دانش فن آوري اطلاعات و سيستم هاي مخابراتي و نيز توان متخصصان داخلي و مجرب در مديريت شهري، سامانه اي را ايجاد نموده است که شهروندان را نسبت به محيط زندگي خويش وارد عرصه مديريت مي نمايد و تلاش نموده امور شهري را با مشارکت فعال همين شهروندان به انجام رساند. از اين رو مي توان سامانه ي 137 را بانك اطلاعاتي دانست كه داده هاي ارزشمندي در زمينه ي مسايل شهري در آن جاي گرفته است.
اطلاعات حاصل از اين سامانه، حاوي مطالب مفيدي در مورد خدمات ارائه شده به شهروندان است و مي تواند به عنوان منبعي مهم و مناسب در انجام تحليل هاي داده کاوي مورد استفاده قرار بگيرد. به عنوان نمونه با استفاده از اين تحليل ها مي توان وقايع و مشکلاتي که ممکن است در آينده گريبان شهر را بگيرد پيش بيني کرد و آماده مقابله با اين مشکلات شد.
در اين تحقيق که از نوع تحقيقات کاربردي -توصيفي محسوب مي شود، داده هاي سال 1389 سامانه 137 با استفاده از نرم افزار کلمنتاين 12 براي انجام فرايند داده کاوي مورد استفاده قرار گرفته است. يکي از نتايج اين تحقيق تعيين همگني مناطق از منظر سامانه 137 با استفاده از تکنيک خوشه بندي به دو دسته است؛ که نشان مي دهد مناطقي که در دسته دوم قرار گرفته اند آمادگي و آگاهي بيشتري براي برقراري ارتباط با سامانه دارند و ميزان تماس بالاتر شهروندان اين مناطق ارتباطي با مشکلات بيشتر آن ها ندارد.
هم چنين با استفاده از قوانين وابستگي ارتباط ميان مشکلات، مناطق و نواحي مورد بررسي قرار گرفته است و مشخص گرديد کدام نواحي در هر منطقه بيشتر مستعد بروز برخي مشکلات و معضلات شهري هستند که شهرداري مي تواند با کسب آمادگي بيشتر از بروز آن جلوگيري نمايد.
علاوه بر آن، نتايج به دست آمده، الگوهاي جالبي را نيز در پيش بيني تعداد تماس هاي مربوط به آب گرفتگي و آب افتادگي يک منطقه بر اساس ميزان بارش و يا تعيين وابستگي ميان پيام هاي آب گرفتگي بين نواحي مختلف يک منطقه خاص به دست داد.
انتظار مي رود نتايج به دست آمده در مديريت مشکلات شهري و افزايش سطح رضايت مندي شهروندان موثر واقع شود.

کلمات کليدي مديريت شهري، سامانه ي 137، داده کاوي، خوشه بندي، قوانين وابستگي، مدل خطي تعميم بافته، شبکه عصبي.
فهرست مطالب
عنوان صفحه
فصل اول: کليات
مقدمه1
1-1- بيان مساله2
1-2- هدف تحقيق3
1-3- سوالات تحقيق3
1-4- اهميت و ضرورت تحقيق4
1-5- قلمرو تحقيق5
1-5-1-از منظر سازماني5
1-5-2-از منظر زماني و مکاني5
1-5-3-از منظر موضوعي5
1-6- روش تحقيق و جمع آوري اطلاعات5
1-7- تعريف واژه ها و اصطلاحات فني6
1-8- خلاصه فصل اول6
فصل دوم: ادبيات تحقيق
مقدمه8
2-1- مباني نظري9
2-1-1-تاريخچه داده کاوي9
2-1-2-تعريف داده کاوي10
2-1-3-انواع داده کاوي11
2-1-4-دلايل استفاده از داده کاوي12
2-1-5-پيش نيازهاي يک داده کاوي موفق12
2-1-6-مراحل فرايند داده کاوي ( استاندارد CRISP-DM )13
2-1-6-1شناخت کسب و کار14
2-1-6-2شناخت داده ها14
2-1-6-3آماده سازي داده ها15
2-1-6-4مدل سازي15
2-1-6-5ارزيابي مدل15
2-1-6-6توسعه ي مدل16
2-1-7-قابليت هاي اساسي داده کاوي16
2-1-7-1 طبقه بندي16
2-1-7-2 پيش بيني17
2-1-7-3تحليل خوشه اي17
2-1-7-4تخمين18
2-1-7-5گروه بندي شباهت يا قوانين وابستگي19
2-1-7-6توصيف و نمايه سازي20
2-1-8-دسته بندي الگوريتم هاي داده کاوي20
2-1-9-الگوريتم هاي خوشه بندي21
2-1-9-1روش افرازي ( تقسيم بندي)21
2-1-9-1-1الگوريتم K-means22
2-1-9-2روش هاي سلسله مراتبي22
2-1-9-3روش هاي مبتني بر چگالي23
2-1-10-الگوريتم هاي وابستگي قواعد23
2-1-10-1الگوريتم Naïve23
2-1-10-2 الگوريتم Apriori24
2-1-11-الگوريتم هاي طبقه بندي26
2-1-11-1الگوريتم درخت طبقه بندي و رگرسيون (CART)26
2-1-11-2الگوريتم درخت تصميم C4.527
2-1-11-3الگوريتم هاي شبکه هاي بيزين29
2-2-1-مديريت شهري و شهرداري30
2-2-2-نقش فن آوري اطلاعات در توسعه ي مديريت شهري31
2-2-3-معرفي سامانه مديريت شهري 137 شهرداري تهران33
2-2-3-1نحوه ي عملکرد سامانه مديريت شهري 13736
2-2-3-2ماموريت هاي مرکز سامانه مديريت شهري 13738
2-2-3-3رويکردهاي اجرايي مرکز سامانه مديريت شهري 13738
2-2-3-4چشم انداز مرکز سامانه مديريت شهري 13739
2-2-3-5ساختار سازماني سامانه مديريت شهري 13739
2-2 مدل مفهومي تحقيق40
2-3- ادبيات ياپيشينه تحقيق40
2-4- خلاصه فصل دوم44
فصل سوم: روش تحقيق
مقدمه46
3-1- نوع تحقيق46
3-2- مدل فرايندي داده کاوي بر اساس استاندارد CRISP-DM47
3-2-1-شناخت کسب و کار47
3-2-2-شناخت داده ها 48
3-2-3-آماده سازي داده ها48
3-2-4-مدل سازي49
3-2-5-ارزيابي مدل49
3-2-6-توسعه مدل49
3-3-داده هاي تحقيق50
3-4-جامعه آماري, روش نمونه گيري و حجم نمونه50
3-5-روش گردآوري اطلاعات و ابزار سنجش50
3-6-نوع داده ها و مقياس آن ها51
3-7-ساختار اجرايي تحقيق51
3-7-1-درک مساله کسب و کار51
3-7-2-درک داده ها52
3-7-3-آماده سازي داده ها53
3-7-4-مدل سازي55
3-7-5-ارزيابي نتايج56
3-7-6-به کارگيري مدل56
3-8-مدل اجرايي تحقيق56
3-9-خلاصه فصل سوم58
فصل چهارم: تجزيه و تحليل داده ها
مقدمه60
4-1- توصيف داده ها60
4-2- تحليل توصيفي داده ها با استفاده از جداول و نمودارهاي توصيفي63
4-2-1-طبقه بندي بر اساس نوع مشکل63
4-2-2-طبقه بندي بر اساس منطقه بروز مشکل66
4-2-3-شاخص‌هاي توصيفي سرانه67
4-3- تحليل داده ها با استفاده از تکنيک هاي داده کاوي70
4-3-1-شناسايي مناطق همگن از منظر سامانه 13770
4-3-1-1ارزيابي خوشه ها76
4-3-2-پيش بيني وضعيت تماس هاي آب گرفتگي در هر يک از مناطق به ازاي بارش هر ميليمتر باران77
4-3-2-1 مدل تعميم يافته خطي77
4-3-2-2مدل شبکه‌هاي عصبي82
4-3-3تعيين ارتباط ميان آب گرفتگي نواحي مختلف يک منطقه84
4-3-4تعيين نواحي مستعدتر در هر منطقه در بروز مشکلات و معضلات شهري86
4-4- خلاصه فصل چهارم87
فصل پنجم: بحث و نتيجه گيري
مقدمه89
5-1-خلاصه89
5-2- دلايل با اهميت بودن نتايج و دستاوردهاي تحقيق90
5-3- جنبه ي نوآوري تحقيق91
5-4- نتايج تحقيق91
5-4-1-نتايج تحليل توصيفي91
5-4-2-نتايج حاصل از تحليل داده کاوي و ارائه ي دانش استخراج شده94
5-4-2-1نتايج حاصل از شناسايي مناطق همگن با استفاده از روش خوشه بندي دو مرحله اي94
5-4-2-2- نتايج پيش بيني تماس هاي آب گرفتگي در هر يک از مناطق به ازاي بارش هر ميليمتر باران95
5-4-2-3تعيين ارتباط ميان آب گرفتگي نواحي مختلف يک منطقه96
5-4-2-4نتايج تحليل قوانين وابستگي براي شناسايي نواحي مستعدتر در هر منطقه در بروز مشکلات و معضلات شهري97
5-5- پاسخ به سوالات تحقيق97
5-6- محدوديت‌هاي تحقيق98
5-7- پيشنهادات تحقيق99
5-8- پيشنهادات جهت تحقيقات آتي100
5-9- خلاصه فصل پنجم101
فهرست منابع102
چکيده انگليسي105
فهرست جداول
عنوان صفحه
جدول 2-1 : نمونه اي از جدول پيام35
جدول 2-2: تحقيقات خارجي در زمينه کاربرد داده کاوي در مراکز تماس444
جدول4-1 : فيلد هاي جدول پيام61
جدول 4-2: فيلد هاي جدول اطلاعاتي مربوط به اعتبار مصوب عمراني مناطق61
جدول4-3: فيلد هاي جدول اطلاعاتي مربوط به بارش مناطق61
جدول4-4: فراواني گروه هاي تماس63
جدول4-5 پراکندگي مشکلات مربوط به گروه جمع آوري و نصب65
جدول4-6 : طبقه بندي مشکلات بر اساس منطقه66
جدول 4-7 سرانه تماس و بودجه مناطق بيست و دو گانه تهران68
جدول4-8: شاخص‌هاي نيکويي برازش78
جدول4-9: آزمون درستنمايي مدل خطي تعميم يافته78
جدول4-10 آزمون عوامل مدل خطي تعميم يافته79
جدول4-11 آزمون ضرائب مدل خطي تعميم يافته79
جدول4-12 بخشي از ارتباط‌هاي دنباله‌اي شناسايي شده85
جدول4-13 قوانين شناسايي شده به روش GRI86
فهرست شکل ها
عنوان صفحه
شکل 2-1 مراحل فرايند کشف دانش و جايگاه داده کاوي.11
شکل2-2 مراحل فرايند CRISP-DM13
شکل 2-1 چرخه گردش پيام- ماخذ: مرکز سامانه 13736
شکل 2-2ساختار سازماني سامانه مديريت شهري سامانه 137-ماخذ: مرکز مديريت سامانه 13739
شکل2-3 مدل مفهومي تحقيق40
شکل3-1وضعيت ايستگاه هاي پنج گانه هواشناسي مستقر در شهر تهران مي باشد.53
شکل3-2 روش اجرايي تحقيق57
شکل4-1: درصد فراواني هر کدام از گروه‌هاي تماس64
شکل 4-2 :سهم مناطق در تماس هاي از نوع “جمع آوري خاک و نخاله” و “نصب سطل زباله مخزن دار”66
شکل4-3: رابطه ميان تعداد تماس، جمعيت و اعتبار مصوب عمراني69
شکل4-4 بررسي نه عامل اول در خوشه بندي73
شکل4-5 بررسي نه عامل دوم در خوشه بندي74
.شکل 4-6 بررسي هفت عامل آخر در خوشه بندي75
شکل 4-7 اعضاي خوشه هاي اول و دوم76
شکل 4-8 : آناليز مدل خطي تعميم يافته81
شکل 4-9: نمودار صعود81
شکل 4-10: مدل شبکه عصبي83
شکل 4-11: آناليز مدل شبکه عصبي84
شکل 5-1 : رابطه ميان تعداد تماس، جمعيت و اعتبار مصوب عمراني93
شکل 5-2 اعضاي خوشه اول و دوم94

کليات
مقدمه
تمايل به شهرنشيني و جاذبه هاي آن در ميان جامعه، به حدي رو به افزايش است که در حال حاضر شهرها به عنوان مهم ترين پايگاه رشد و توسعه و مرکز اصلي تحولات قرار گرفته اند. بنابراين در مسير دستيابي به توسعه ي پايدار، شهر يک شاخص مهم تلقي مي گردد که رشد وبالندگي آن ارتباط مستقيم با چگونگي مديريت و دستاورد هاي حاصله دارد.
مشارکت اگرچه به معناي عام آن از ديرباز با زندگي انسان پيوند داشته، اما به معناي جديد از عرصه سياست و پس از جنگ جهاني دوم آغاز شده است. اين نوع مشارکت در برخي از کشورهاي صنعتي جهان، در قلمرو اقتصادي و صنعتي آغاز شد؛ تا مردم را در مالکيت شريک سازد و پايه هاي پايدار و تداوم صنعت و اقتصاد را مستحکم سازد.
اما تازه ترين زمينه ي مشارکت، مشارکت شهروندان در اداره ي امور شهرهاست. اين نوع مشارکت يکي از الزامات زندگي شهري است و هنگامي تحقق مي يابد که شهرنشينان از حالت فردي که صرفاً در مکاني به نام شهر زندگي مي کنند درآيند و به شهروند بدل شوند.
مي توان گفت يکي از مسائل مهم در عرصه ي مديريت شهري، نحوه ي ارزيابي شهروندان از عملکرد مديريت شهري، اعتماد به اين نهاد و مشارکت در آن است. در اين ميان، نحوه ي عملکرد مديريت شهري، خود مي تواند عامل مهمي براي ميزان اعتماد شهروندان به مديريت شهري و مشارکت با آن باشد.
به عبارت ديگر با توجه به گسترش شهر نشيني و مهاجرت به شهرها، به خصوص كلان شهر تهران و با
در نظر گرفتن جمعيت ميليوني اين شهر، عدم كارايي مديريت سنتي شهر و لزوم بهره گيري از مديريت متمركز همراه با به كارگيري از بروزترين دانش فن آوري اطلاعات، احساس مي شود. يكي از مشكلات بارز شهر تهران، عدم اطلاع به موقع مديران شهري از وجود و بروز حوادث و مشكلات در شهر مي باشد كه مشاركت بيشتر شهروندان در اداره ي شهر و برقراري ارتباط مستقيم مردم با سيستم مديريت شهري از طريق يك وسيله در دسترس و ارزان قيمت راه حل اين معضل بزرگ مي باشد(اميري 1389).
از اين رو شهرداري تهران در يک اقدام ابتکاري و با استفاده از فن آوري هاي نوين اطلاعاتي و ارتباطاتي، به راه‌اندازي سامانه ي مديريت شهري 137 جهت ايجاد ارتباط مستقيم شهروندان با مديران شهري به منظور انتقال نظرات و خواسته‌ها و بيان مشکلات مربوط به امور مديريت شهري اقدام کرده است.
از طرفي تنوع و پيچيدگي در حوزه ي خدمات شهرداري، دسترسي به دانش مناسب براي تصميم گيري و توليد اطلاعات از ميان حجم انبوهي از داده ها را براي اين سازمان، بيش از پيش ضروري مي سازد. استفاده از فن آوري اطلاعات و ارتباطات نقش اساسي در حل مسائل تهران و کلان شهرها دارد. اين مساله به ويژه در مديريت شهري، اقتصاد شهري، توليد شغل و ارتقاي سطح فرهنگ شهروندي نقشي اساسي ايفا مي کند(هراتي زاده، 1386). يکي از ابزارهاي مناسب جهت ايجاد اين دانش سازماني و کمک به مديران در تصميم سازي و تصميم گيري صحيح به کارگيري فن آوري هاي نوين، نظير داده کاوي1 است.
از اين رو هدف اين تحقيق، به کارگيري تکنيک هاي داده کاوي در شناسايي و پيش بيني، نيازها و مشکلات شهري بر اساس داده هاي بدست آمده از سامانه ي مديريت شهري 137 مي باشد.
بيان مساله
شهرها، امروزه بسيار پيچيده شده اند. مشکلات متعددي هم چون آلودگي هوا، آلودگي صوتي، توليد انبوه زباله، دفن زباله هاي توليدي، توسعه معابر و آسفالت، فضاي سبز، بهداشت، و … شهرها را احاطه کرده اند. با توسعه ي شهرها وظايف شهرداري ها در خدمت رساني هم توسعه پيدا کرده است. در مديريت‌ شهري‌ امروز که آن را اداره‌ امور شهر به‌منظور ارتقاي مديريت‌ پايدار مناطق‌ شهري‌ در سطح‌ محلي و‌ با تبعيت‌ از اهداف‌ سياست هاي‌ ملي، اقتصادي‌ و اجتماعي‌ کشور مي دانند، مشارکت و تعامل، مفاهيمي محوري مي باشند(ويژه‌نامه‌ مرکز مطالعات‌ برنامه‌ريزي‌ شهري، شهرداري‌ تهران‌ 1387، ص 7).
يکي از راه هاي مشارکت شهروندان در اداره ي امور شهر برقراري ارتباط با شهرداري از طريق سامانه 137 مي باشد. اين سامانه که در رويكردي نوين توسط شهرداري تهران و با بهره مندي از دانش فن آوري اطلاعات، ايجاد شده است سعي در انجام سريع و دقيق امور شهري با نظر مستقيم و مشاركت فعال شهروندان دارد و تلاش مي نمايد ساكنين شهر را نسبت به محيط زندگي خويش وارد عرصه ي مديريت نمايد.
از نگاهي ديگر سامانه 137 يك بانك اطلاعاتي است كه داده هاي ارزشمندي در مورد مسايل شهري را در خود جاي داده است. كليه پيام ها و درخواست هاي مردم در بانك اطلاعاتي مركز سامانه 137 ذخيره شده و با استفاده از اين داده ها مي توان تحليل هايي كاربردي در بازه هاي زماني مختلف و به تفكيك لايه هاي مختلف اطلاعاتي مانند مناطق، نواحي و واحدهاي مختلف سازماني ارائه كرد. با استفاده از اين تحليل ها مي توان وقايع و مشكلاتي كه ممكن است در آينده گريبان شهر را بگيرد پيش بيني كرد و آماده مقابله با اين مشكلات شد. توانايي استخراج دانش مفيد نهفته در اين داده ها در جهان امروزي خود يک توانايي رقابتي محسوب مي شود و در چنين شرايطي است که بايد از رشد تکنولوژي براي استفاده موثر از اين ثروت بالقوه سود جست و داده کاوي نيز يک جواب بهينه براي استخراج اين ثروت است.
داده کاوي که يکي از ده دانش در حال توسعه مي باشد امروزه در امور کسب و کار مورد توجه بيشتر سازمان ها قرار گرفته است و هدف آن استخراج اطلاعات از پايگاه هاي داده و يافتن الگوهاي جديد، معتبر، مفيد و قابل فهم در داده ها مي باشد (http:// www.wikipedia.org).
در طول دهه گذشته، حجم زيادي از داده ها در پايگاه داده ها انباشته و ذخيره شده اند و نتيجه اين انباشتگي اين است که سازمان ها در داده غني ولي در کسب دانش بسيار ضعيف مي باشند. امروزه ميزان داده هاي در دسترس هر 3 سال دو برابر مي شود و سازماني تواناست که قادر باشد حداقل 7 درصد از اطلاعاتش را مديريت نمايد. تحقيقات انجام يافته نشان از آن دارد که سازمان ها امروزه کمتر از يک درصد از داده هايشان را براي تحليل استفاده مي نمايند. به عبارت ديگر امروزه سازمان ها در اطلاعات غرق شده اند در حالي که گرسنه دانش هستند؛ چرا که سازمان ها داده هاي زيادي را در تصرف خود دارند درحالي که هنوز با فقدان دانش پنهان درون داده ها مواجه هستند(www.irandatamining.ir).
هدف تحقيق
به کارگيري برخي از قابليت هاي داده کاوي نظير Clustering، Association Rules و … بر روي اطلاعات سامانه ي137 و کشف روابط و الگوهاي پنهان ميان داده ها با استفاده از تکنيک هاي مختلف هريک از آن ها و بررسي و تحليل نتايج به دست آمده به منظور ارتقاي کيفيت خدمات شهري.
سوالات تحقيق
چگونه مي توان با استفاده از تکنيک هاي داده کاوي بر روي داده هاي سامانه 137 شهرداري تهران به پيش بيني مشکلات مناطق22 گانه شهرداري در حوزه ي کلان شهري پرداخت؟
چگونه مي توان با استفاده از تکنيک هاي داده کاوي بر روي داده هاي سامانه 137 شهرداري به کشف الگوي پنهان ميان مشکلات مناطق و حوزه هاي مختلف شهرداري دست يافت؟
اهميت و ضرورت تحقيق
با رشد فزاينده ي جمعيت در کلان‌شهر تهران و به دنبال آن افزايش مشکلات و مسائل ناشي از شهرنشيني در ابعاد وسيع اقتصادي، اجتماعي، فرهنگي و زيست‌محيطي، لزوم ايجاد و استفاده از بسترهاي مديريت شهري جديد همراه با به‌روزترين و کاربردي‌ترين فن آوري‌ها احساس مي‌شود (اميري، 1388،ص3 ).
تهران با جمعيت بيش از 8217236 نفر(سالنامه آماري شهر تهران- 1388) و مساحت 730 کيلومتر مربع پرجمعيت ترين کلان شهر ايران محسوب مي شود. ناگفته پيداست که ارائه خدمات شهري در چنين کلان شهري با تراکم بيش از 11256 نفر بر کيلومتر مربع که سفرهاي آونگي2 ساکنين شهرهاي دور و نزديک اطراف نيز به جمعيت روز آن مرتباً مي افزايد، نيازمند به کارگيري تمهيدات ويژه بوده و بدون حضور و نقش فعال شهروندان امکان پذير نمي باشد.
يکي از مشکلات رايج و فراگيري که در مديريت كلان‌شهر تهران مشاهده مي‌شود، ضعف دريافت اطلاعات به موقع مديران شهري درباره نيازهاي شهروندان و تشخيص ضرورت‌هاي ارائه خدمات شهري در نواحي و مناطق مختلف شهرداري مي‌باشد. در اين ميان يکي از بهترين روش‌ها براي کسب اطلاعات دقيق در زمينه ي مسائل و مشكلات شهروندان و دريافت نقطه‌نظرات مردم پيرامون مديريت شهري، ايجاد خطوط ارتباطي مناسب با شهروندان و كسب اطلاعات از طريق خود آنان مي‌باشد و اين مهم با ايجاد سامانه اي موسوم به 137 در شهرداري تهران دنبال مي‌شود.
از اين رو شماره 137 پل ارتباطي بين شهروندان و شهرداري تهران است؛ که به شهروندان اجازه مي دهد مشکلات و کمبودهاي موجود در شهر را به اطلاع شهرداري برسانند. به عبارت ديگر سامانه 137، که از سال 1384 جايگزين صندوق صوتي پيام گير شهرداري گرديده است، فرايندي است که با سرلوحه قرار دادن اصول شهروند مداري، محله گرايي و مشارکت مردمي به اجرا در آمده تا اين مشکلات و درخواست هاي شهروندان را رسيدگي و برطرف نمايد.
کاوش داده ها و اطلاعات جمع آوري شده از طريق اين سامانه مي تواند منجر به شناسايي الگوهاي مهم و پنهاني شود که پيش از آن ممکن است مورد توجه قرار نمي گرفته و دانستن آن مديران شهري را در ارائه ي مطلوب خدمات شهري به شهروندان ياري مي رساند. زيرا دانش داده کاوي سازمان ها را قادر مي سازد تا از سرمايه ي داده هايشان بهره برداري نمايند. از اين ابزار براي پشتيباني فرايند تصميم گيري استفاده مي گردد. داده کاوي با پردازش جامع داده و انجام فرايند تصميم سازي از طريق استخراج دانش با ارزش از داده، تصميم گيري را براي مديران سازمان تسهيل مي نمايد.
قلمرو تحقيق
از منظر سازماني
قلمرو اين تحقيق از منظر سازماني، مرکز مديريت شهري سامانه ي 137 شهرداري تهران است که از سال 1384 جايگزين صندوق صوتي پيام گير شهرداري گرديده و اصول شهروند مداري، محله گرايي و مشارکت مردمي را سرلوحه خود در رسيدگي به درخواست ها و مشکلات مردم شهر تهران نموده است.
از منظر زماني و مکاني
قلمرو اين تحقيق از منظر مکاني – زماني، پيام ها و درخواست هاي واصله شهروندان در همه مناطق 22 گانه شهرداري تهران است که در طول فروردين تا اسفند ماه سال 1389 از طريق کانال هاي ارتباطي با 137 دريافت شده است.
از منظر موضوعي
از منظر موضوعي اين تحقيق در حوزه ي کاربرد داده کاوي در مديريت شهري جاي دارد. به اين ترتيب که در نتيجه داده کاوي سامانه 137 و کشف دانش پنهان ميان داده ها، به توسعه مديريت شهري خواهيم رسيد. کشف دانش پنهان منجر به تسهيل در امر تصميم سازي مديران، تخصيص بهينه منابع و آمادگي بيشتر در مقابل معضلات شهري خواهد شد. و در نتيجه توسعه مديريت شهري به افزايش مشارکت هاي مردمي و به کارگيري هر چه بيشتر فن آوري هاي نوين اطلاعاتي در فرايندهاي شهري نايل مي شويم.
روش تحقيق و جمع آوري اطلاعات
تحقيق حاضر از نظر هدف کاربردي و از نظر روش تشريحي محسوب مي شود. در اجراي تکنيک هاي
داده کاوي، از نرم افزار Clementine 12 استفاده شده است. دليل استفاده از اين نرم افزار توانايي آن در پردازش مجموعه هاي داده اي بزرگ3 و متداول بودن آن در ميان کاربران است. در بخش آماده سازي داده ها از نرم افزارهايي نظير Sql server 2008، Excel 2007 و Spss 16 استفاده شده است.
داده هاي اصلي اين تحقيق شامل برشي از بانک داده سامانه 137 در مقطع سال 89 مي باشد که از طريق مراجعه حضوري به آن مرکز و طي مراحل استاندارد و قانوني گرد آوري گرديده است. ساير داده هاي تحقيق که شامل اعتبار مصوب عمراني مناطق و ميزان بارش روزانه در سال 89 مي شود از اطلاعات معتبر منتشر شده در سايت اينترنتي شهرداري و هواشناسي به دست آمده است.
تعريف واژه ها و اصطلاحات فني
داده کاوي(Data Mining): علم استخراج اطلاعات مفيد از پايگاه‌هاي داده يا مجموعه داده‌اي مي‌باشد.
انباره داده ها (Data Warehouse) : مجموعه اي از داده هاي ذخيره شده به شکل الکترونيکي در يک سازمان که به منظور استفاده در فعاليت هاي تحليلي و گزارش گيري طراحي و راه اندازي شده است.
خوشه بندي(Clustering): يکي از تکنيک هاي مهم داده کاوي است که اشياء با تعداد زيادي مشخصه را به زيرگروههاي معني دار جدا ازهم تقسيم بندي مي کند. به طوري که اعضاي هر گروه از نظر مقدار مشخصه هايشان، بيشترين شباهت را به هم دارند و با اعضاي ساير گروه ها بيشترين تفاوت را دارند.( هن و کمبر 2006)
قوانين وابستگي (Association Rules): هدف قوانين وابستگي تعيين کردن اين است که چه پديده هايي با هم در ارتباط بوده و به هم وابسته اند. نمونه ي اصلي اين کار تعيين اقلامي است که با هم در چرخه ي خريد مشتريان يک سوپرمارکت قرار مي گيرند.
خلاصه فصل اول
در اين فصل به کليات تحقيق پرداخته شد که شامل: بيان مساله، هدف تحقيق، سوالات تحقيق، اهميت و ضرورت تحقيق، قلمرو سازماني- زماني و مکاني- موضوعي تحقيق، روش تحقيق و جمع آوري اطلاعات، تعريف واژه ها و اصطلاحات فني مي شد. توضيحات لازم ذيل هر بخش به تفصيل آورده شده است تا تصويري جامع و کلي از چارچوب تحقيق انجام يافته ارائه شود.

ادبيات تحقيق

مقدمه
اصولاً پيدايش و رواج اصطلاح مديريت شهري4 به مفهوم جديد آن را بايد نتيجه ي تلاش هاي نظري و عملي براي غلبه بر انبوه مشکلات موجود در کلان شهرها به ويژه در نيمه دوم قرن بيستم دانست ( کاظميان، 1382، صص 43و 51). مديريت شهري معاني و محتواهاي متفاوتي براي انديشمندان مختلف در برداشته و دارد. مفاهيم و تعاريف اوليه در چارچوب سنت و طرز تلقي محدود، تکنوکراتيک و سياست زدايي شده از مديريت شهري ارائه شده اند. همه ي اين تعاريف مديريت شهري را در چارچوب اداره ي امور عمومي محدود مي کنند(Mattingly, 1994).
امروزه شهرها با افزايش مداوم جمعيت و نيازهاي اجتماعي وابسته به آن روبرو هستند ولي منابعي که در اختيار شهرداري ها قرار مي گيرد به همان نسبت افزايش نمي يابد. اهميت حفظ تعادل بين نيازهاي اجتماعي، اقتصادي و محيطي نسل حاضر و آينده از طيف توسعه انساني پايدار، تغيير پارادايمي را در مديريت شهري و ارائه ي خدمات شهري به وجود آورده است. اين تغيير پارادايم به ورود مفاهيمي چون مشارکت شهروندي، جامعه مدني، مقتدرسازي5، مشغوليت مدني6 و حکمراني شهري انجاميده است(شريفيان ثاني، 1388، ص 43).
مشاوره و کسب نظر شهروندان، در صورتي که واقعي باشد، سودمند است. مخالفان نظارت شهروندي چنين نظارتي را سد راه ارائه ي خدمات مطلوب مي دانند. مشارکت عمومي همواره، امري مطلوب به شمار مي آيد، اما برنامه ريزان در عمل، براي جلب مشارکت شهروندان با مشکل روبرويند. مشارکت گونه هاي مختلف دارد که برخي از آن ها عبارتند از: مشارکت از طريق مشاوره و درخواست پاسخ به پرسش ها از سوي اجتماعات و مشارکت به دليل انگيزه هاي مادي که در آن اجتماع منابعي مانند نيروي کار و پول و غذا را در برابر محرک هاي مادي در اختيار مي گذارند(شريفيان ثاني، 1388، ص 42).
يکي از جنبه هاي بارز مشارکت مردم در اداره ي امور شهر برقراري ارتباط با شهرداري از طريق سامانه ي مديريت شهري 137 شهرداري تهران مي باشدکه تلاش نموده با سرلوحه قرار دادن اصول شهروند مداري، محله گرايي و مشارکت مردمي به رسيدگي به درخواست ها و مشکلات مردم شهر تهران بپردازد.
از طرف ديگر، امروزه شهرداري ها نيز هم چون ديگر سازمان ها غرق در انبوه داده ها و اطلاعاتي هستند که استفاده از آن ها در بيشتر موارد، محدود به انجام کارهاي جاري شده است. داده کاوي که استفاده از آن نيز روز به روز توسعه مي يابد، مي تواند منجر به استفاده از اين اطلاعات در زمينه ي تصميم گيري هاي استراتژيک شود.
در اين فصل به ارائه ي مباني نظري تحقيق، مفاهيم و ابعاد تحقيق و مدل مفهومي تحقيق مي پردازيم.

مباني نظري
تاريخچه داده کاوي
ايده اي که مبناي داده کاوي است، يک فرايند با اهميت از شناخت الگوهاي بالقوه مفيد، بديع و نهايتاً قابل درک از داده هاست. واژه “کشف دانش در پايگاه داده ها”7 که به معناي جستجوي دانش در اطلاعات است، در اوايل دهه 80 شکل گرفته است. کشف دانش و داده کاوي يک حوزه جديد، ميان رشته اي و در حال رشد است که حوزه هاي مختلفي هم چون پايگاه داده، آمار، يادگيري ماشين8، مصور سازي9، هوش مصنوعي10، بازشناسي الگو11 و ساير زمينه هاي مرتبط را با هم تلفيق کرده است تا اطلاعات و دانش ارزشمند نهفته در حجم بزرگي از داده ها را استخراج نمايد( فياد و همکاران، 1996، هن و کمبر، 2006).
هن و کمبر (2006) داده کاوي را به صورت استخراج يا کاوش دانش از مقادير عظيم داده ها تعريف کرده و داده کاوي را مهم ترين مرحله در فرايند کشف دانش معرفي کرده اند. جايگاه استخراج دانش و کاوش داده ها در شکل 2-1 نشان داده شده است.
تعريف داده کاوي
داده کاوي به استخراج يا کاوش دانش از حجم زيادي داده اطلاق مي شود که در واقع تشبيهي از کاوش طلا از صخره ها و سنگ هاست. کاوش واژه اي صريح و روشن است که فرايند يافتن يک مجموعه ي کوچک از مواد با ارزش در حجم زيادي از مواد خام را توصيف مي کند. به اين ترتيب مفهوم داده کاوي به عنوان يک مفهوم کلي و عام مشخص مي شود. واژه هاي ديگري هم در متون علمي ديده مي شوند که مفاهيمي مشابه يا کاملاً نزديک به داده کاوي دارند؛ مثل کاوش دانش از بانک هاي اطلاعاتي، استخراج دانش، تحليل داده يا الگو.(Frawley 1992)
تعاريف مختلفي از داده کاوي ارائه شده است که چند مورد آن در زير آورده شده است:
داده کاوي استخراج اطلاعات مفهومي، ناشناخته و به صورت بالقوه مفيد از پايگاه داده مي باشد (Frawley 1992).
داده کاوي به معناي يافتن نيمه خودکار الگوهاي پنهان موجود در مجموعه داده هاي موجود مي باشد( هن و کمبر 2006).
داده کاوي علم استخراج اطلاعات مفيد از پايگاه هاي داده يا مجموعه داده اي مي باشد(هاند و ديگران 2001).
داده کاوي استخراج نيمه اتوماتيک الگوها، تغييرات، وابستگي ها، نابهنجاري ها و ديگر ساختارهاي معني دار آماري از پايگاه هاي بزرگ داده مي باشد(Larsed 2003).
داده کاوي عبارت است از فرايند اکتشاف دانش در بانک هاي اطلاعاتي به منظور يافتن الگوهاي معتبر، مفيد، جديد و قابل درک از داده ها(شهرابي، 1389).
داده کاوي مجموعه اي از تکينک هاي اکتشاف دانش در بانک هاي اطلاعاتي بر مبناي روش هاي پيشرفته تحليلي است که به عنوان ابزاري براي کارکردن بر روي اطلاعات با حجم بالا و کشف الگوهاي جديد در اين اطلاعات به کار مي رود (Gupta 2006).
داده کاوي تلاشي براي ارائه ي بينشي هوشمندانه به مديران براي شناخت بهتر کسب و کار و پيش بيني شرايط آينده، در طي يک فرايند پيچيده است (Gupta 2006).
داده کاوي در واقع يک فن آوري ميان گروهي است که با همکاري متخصصين بانک هاي اطلاعاتي، محرمانگي و امنيت اطلاعات، هوش مصنوعي و يادگيري ماشيني، آمار و گرافيک انجام مي- شود(فياد و همکاران، 1996، هن و کمبر، 2006).
شکل 2-1 مراحل فرايند کشف دانش و جايگاه داده کاوي(آخوندزاده نوقابي، 1388).
انواع داده کاوي
در عمل دو هدف مهم و اساسي داده کاوي، پيش بيني12 و تشريح13 است. در پيش بيني، بعضي از متغيرها يا حوزه هايي از مجموعه هاي داده اي به منظور پيش بيني ارزش ناشناخته يا آينده ي داده هاي ديگر مورد استفاده قرار مي گيرند، از سوي ديگر تشريح، بر يافتن الگوهاي تشريحي داده ها که مي توانند به وسيله انسان تعبير شوند تمرکز مي نمايد. در نتيجه داده کاوي را مي توان در يکي از گروه هاي زير جاي داد:
در داده کاوي پيش بيني کننده با استفاده از داده ها، مدل هايي براي پيش بيني مقادير متغيرهاي مورد نظر توليد مي گردد.
داده کاوي تشريحي با استفاده از الگوهايي که در اعداد مي يابد به تجزيه و تحليل و علت يابي يک يا چند پديده مي پردازد.
ازنظر پيش بيني کننده، هدف از داده کاوي توليد مدلي است که با استفاده از يک کد اجرايي، وظايفي چون پيش بيني، دسته بندي، تخمين مقدار، تخمين عملکرد و غيره را انجام دهد.
از نظر تشريح کننده، هدف حصول درکي کامل از سيستم تحليل شده به وسيله الگوهاي پنهان در آن و روابط درون مجموعه هاي داده اي است(مرکز مطالعات و برنامه ريزي شهر تهران 1388، ص 3).
دلايل استفاده از داده کاوي
در سال هاي اخير استفاده از تکنيک هاي داده کاوي رشد بسيار سريعي داشته است که از دلايل اين امر مي توان به موارد ذيل اشاره کرد(Gupta 2006):
سهولت توليد داده ها با استفاده از پردازش تحليلي برخط14.
افزايش داده هاي ايجاد شده از طريق ابزارهاي الکترونيکي از قبيل تراکنش هاي خريد، عمليات بانک، کارت هاي اعتباري و ماهواره ها.
افزايش داده هاي ايجاد شده از طريق صفحات وب.
افزايش حجم ابزاهاي ذخيره داده ها شامل انواع حافظه ها.
کاهش هزينه هاي پردازش اطلاعات.
وجود محيط هاي رقابتي با توجه به جهاني شدن کسب و کار.
وجود نرم افزارهاي مفيد داده کاوي.
پيش نيازهاي يک داده کاوي موفق
براي انجام يک داده کاوي موثر، لازم است قبل از شروع به موارد زير توجه داشت(Gupta 2006):
ضمن آشنايي کامل با موضوع مورد بحث، مسئله ي داده کاوي به درستي تعريف و تبيين شده باشد.
داده ها موجود باشند.
داده هاي موجود مرتبط، کافي، مناسب و پاک سازي شده باشند.
مسئله با روش هاي پرس و جو يا ساير ابزارهاي کار با بانکهاي اطلاعاتي قابل حل نباشد.
نتايج حاصل از داده کاوي قابل اجرا و عملياتي باشد.
مراحل فرايند داده کاوي ( استاندارد 15CRISP-DM )
فرايند CRISP-DM يک متدولوژي استاندارد داده کاوي مي باشد که در اواخر سال 1996 توسط سه شرکت بزرگ دايملر کرايسلر (بنز)16، SPSS، و NCR ايجاد گرديد. اين متدولوژي، يک مدل فرايندي براي داده کاوي ارائه مي دهد که مروري بر چرخه ي عمر هر پروژه ي داده کاوي بوده و شامل مراحل متناظر با يک پروژه، وظايف مربوطه و ارتباط بين اين وظايف مي باشد.
گام هاي اين متدولوژي در ادامه بيان شده است.

چرخه ي عمر يک پروژه ي داده کاوي، شامل 6 مرحله مي باشد که در شکل2-2 نشان داده شده است. توالي اين مراحل انعطاف پذير مي باشد و برگشت به مراحل قبلي و مسير هاي آزاد بين مراحل گاهي مورد نياز است. جهت پيکان هايي که در شکل مشاهده مي گردد، بيان کننده ي مهم ترين و تکراري ترين وابستگي هاي بين مراحل مي باشد.
شناخت کسب و کار17
در اين مرحله لازم است که اهداف پروژه و نيازها از ديدگاه کسب و کار به طور مشخص تبيين شود. توجه به اين مرحله بسيار ضروري است و با شناخت کامل اهداف مي توان از قابليت هاي داده کاوي بهترين استفاده را کرد و الگوريتم مناسب را انتخاب نمود(هن و کمبر 2006).
گام هاي اين مرحله عبارتند از:
تعيين اهداف کسب و کار ( مفاهيم اوليه، اهداف و معيارهاي موفقيت).
ارزيابي موقعيت ( موجودي منابع، نيازمندي ها، فرضيه ها و محدوديت ها، ريسک ها و روابط، اصطلاحات و هزينه و فايده).
تعيين اهداف داده کاوي ( اهداف داده کاوي و معيار موفقيت).
توليد طرح پروژه.
شناخت داده ها18
در اين مرحله مواردي از قبيل موجود بودن داده ها، محرمانگي داده ها، چگونگي دسترسي به داده ها و ميزان سيستمي بودن داده ها بررسي مي شود. تحليل صحيح در اين مرحله ممکن است به تجديد نظر در مرحله يک (شناخت کسب و کار) بيانجامد. جمع آوري و آشنايي با داده ها، شناخت مسائل مربوط به کيفيت داده ها و مشاهده ي اطلاعات اوليه ي نهاني يا زيرمجموعه هاي داده ها که ممکن است براي آناليز جالب باشند از وظايف اين مرحله است (هن و کمبر 2006).
گام هاي اين مرحله عبارتند از:
جمع آوري اوليه داده ها
توصيف داده ها
شناسايي داده ها
تاييد کيفيت داده ها
آماده سازي داده ها19
در اين مرحله داده هاي موجود جهت استفاده ي الگوريتم داده کاوي آماده مي شود. هدف اين مرحله رسيدن به چشم انداز قابل کاوش است. در اين مرحله يکپارچگي، انتخاب، پاکسازي و تغيير شکل داده ها انجام مي شود (هن و کمبر 2006).
گام هاي اين مرحله عبارتند:
انتخاب داده ها
پاکسازي داده ها
ساختار دهي داده ها ( انتخاب برخي صفات و ايجاد رکوردها)
يکپارچه نمودن داده ها ( داده هاي ترکيبي)
فرمت کردن داده ها
مدل سازي20
اين مرحله شامل پياده سازي تکنيک هاي مدل سازي يا داده کاوي بر روي ديدگاه قابل کاوش ايجاد شده در مرحله ي قبل است (هن و کمبر 2006).
گام هاي اين مرحله عبارتند از:
انتخاب تکنيک مدل سازي (فرضيه ها و تکنيک هاي مدل سازي)
ارزيابي طراحي ( طراحي آزمايشي)
ساخت مدل (پارامترهاي انتخاب شده و توصيف مدل)
ارزيابي مدل (سنجش مدل و بازنگري در پارامترهاي انتخاب شده)
ارزيابي مدل21
در اين مرحله مدل طراحي شده مورد ارزيابي قرار مي گيرد تا مشخص شود آيا اهداف داده کاوي تامين شده است . به عبارت ديگر بايد مشخص شود که آيا مدل براي پاسخگويي به برخي از نيازهاي کسب و کار مفيد است يا خير. بعد از ارزيابي مدل ممکن است به بازنگري در اهداف تعيين شده در مرحله ي اول منجر شود (هن و کمبر 2006).
گام هاي اين مرحله عبارتند از:
ارزيابي نتايج
تجديد نظر در فرايند
طراحي گام هاي بعدي (ليست فعاليت ها و تصميم هاي ممکن)
توسعه ي مدل22
ايده ي اين مرحله به کارگيري پتانسيل هاي مدل استخراج شده، ترکيب آن با فرايند هاي تصميم گيري سازمان، ارائه گزارش هايي در مورد دانش استخراج شده و … مي باشد. در اين مرحله مدل، پياده سازي و اجرا مي گردد و معمولاً يک رابط گرافيکي مناسب نيز براي کاربران طراحي مي شود (هن و کمبر 2006).
گام هاي اين مرحله عبارتند از:
برنامه ريزي براي توسعه
برنامه ريزي براي مانيتور و نگهداري
توليد گزارش نهايي
بازنگري مجدد پروژه
قابليت هاي اساسي داده کاوي
طبقه بندي23
طبقه بندي فرايند جستجوي مجموعه اي از مدل ها يا توابع است که کلاس هاي داده ها يا مفاهيم را توصيف يا تفکيک مي نمايد. تا بتوان از اين مدل براي پيش بيني کلاس اشيا استفاده کرد. مدل استخراج شده بر پايه تحليل مجموعه اي داده هاي آموزشي يا داده هايي که کلاس آن ها مشخص است مي باشد(هن و کمبر 2006).
فرايند طبقه بندي در واقع نوعي يادگيري با ناظر مي باشد که



قیمت: تومان


پاسخ دهید