مهندسی کامپیوتر

تحقيق مقدمه ای بر داده کاوی

مقدمه ای بر داده‌کاوی
در دو دهه قبل توانايي های فنی بشر در برای
توليد و جمع آوری داده‌ها به سرعت افزايش يافته است. عواملی نظير استفاده
گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب و کار،
علوم، خدمات دولتی و پيشرفت در وسائل جمع آوری داده، از اسکن کردن متون و
تصاوير تا سيستمهای سنجش از دور ماهواره ای، در اين تغييرات نقش مهمی دارند
[‎1].
بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم
اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. اين
رشد انفجاری در داده‌های ذخيره شده، نياز مبرم وجود تکنولوژی های جديد و
ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا
اين حجم زياد داده را به اطلاعات و دانش تبديل کند: داده کاوی به عنوان يک
راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی داده کاوی
فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي کنند،
که اين دانش به صورت ضمنی در پايگاه داده های عظيم، انباره داده و ديگر
مخازن بزرگ اطلاعات، ذخيره شده است. داده کاوی بطور همزمان از چندين رشته
علمی بهره مي برد نظير: تکنولوژی پايگاه داده، هوش مصنوعی، يادگيری ماشين،
شبکه های عصبی، آمار، شناسايی الگو، سيستم های مبتنی بر دانش ، حصول دانش ،
بازيابی اطلاعات ، محاسبات سرعت بالا و بازنمايی بصری داده . داده کاوی
در اواخر دهه 1980 پديدار گشته، در دهه 1990 گامهای بلندی در اين شاخه از
علم برداشته شده و انتظار می رود در اين قرن به رشد و پيشرفت خود ادامه دهد
[‎2].
واژه های «داده کاوی» و «کشف دانش در پایگاه داده» اغلب به صورت
مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان يک فرآيند
در شکل1-1 نشان داده شده است.
کشف دانش در پایگاه داده فرایند شناسایی
درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها می باشد.
داده کاوی، مرحله ای از فرایند کشف دانش می باشد و شامل الگوریتمهای مخصوص
داده کاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و
یا مدلها را در داده کشف می کند [‎1]. به بیان ساده تر، داده کاوی به
فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می شود.
تعریف دیگر اینست که، داده کاوی گونه ای از تکنیکها برای شناسایی اطلاعات و
یا دانش تصمیم گیری از قطعات داده می باشد، به نحوی که با استخراج آنها،
در حوزه های تصمیم گیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار
گیرند. داده ها اغلب حجیم ، اما بدون ارزش می باشند، داده به تنهایی قابل
استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این
دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه گفته می شود.

1-1 چه چيزی سبب پيدايش داده کاوی شده است؟
اصلی
ترين دليلی که باعث شد داده کاوی کانون توجهات در صنعت اطلاعات قرار
بگيرد، مساله در دسترس بودن حجم وسيعی از داده ها و نياز شديد به اينکه از
اين داده ها اطلاعات و دانش سودمند استخراج کنيم. اطلاعات و دانش بدست آمده
در کاربردهای وسيعی از مديريت کسب و کار وکنترل توليد و تحليل بازار تا
طراحی مهندسی و تحقيقات علمی مورد استفاده قرار می گيرد.
داده کاوی را
می توان حاصل سير تکاملی طبيعی تکنولوژی اطلاعات دانست، که اين سير تکاملی
ناشی از يک سير تکاملی در صنعت پايگاه داده می باشد، نظير عمليات: جمع آوری
داده ها وايجاد پايگاه داده، مديريت داده و تحليل و فهم داده ها. در
شکل1-2 اين روند تکاملی در پايگاه های داده نشان داده شده است ]‎3[.

فهرست
1 مقدمه ای بر داده‌کاوی 3
1-1 چه چيزی سبب پيدايش داده کاوی شده است؟ 4
1-2 مراحل کشف دانش 6
1-3 جایگاه داده کاوی در میان علوم مختلف 11
1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟ 12
1-5 داده کاوی و انبار داده ها 13
1-6 داده کاوی و OLAP 14
1-7 کاربرد یادگیری ماشین و آمار در داده کاوی 15
2- توصیف داده ها در داده کاوی 15
2-1 خلاصه سازی و به تصویر در آوردن داده ها 15
2-2 خوشه بندی 16
2-3 تحلیل لینک 16
3- مدل های پیش بینی داده ها 17
3-1 Classification 17
3-2 Regression 17
3-3 Time series 18
4 مدل ها و الگوریتم های داده کاوی 18
4-1 شبکه های عصبی 18
4-2 Decision trees 22
4-3 Multivariate Adaptive Regression Splines(MARS) 24
4-4 Rule induction 25
4-5 K-nearest neibour and memory-based reansoning(MBR) 26
4-6 رگرسیون منطقی 27
4-7 تحلیل تفکیکی 27
4-8 مدل افزودنی کلی (GAM) 28
4-9 Boosting 28
5 سلسله مراتب انتخابها 29

دانلود فایل

دانلود فایل”تحقيق مقدمه ای بر داده کاوی”

مهندسی کامپیوتر

تحقیق داده کاوي و اکتشاف دانش

دانلود پایان نامه با موضوع داده کاوي و اکتشاف دانش،
در قالب word و در 94 صفحه، قابل ویرایش، شامل:
فصل اول: مقدمه اي بر داده كاوي
1-1 مقدمه 
1-2 داده كاوي چيست ؟   
1- 3 مفاهيم پايه در داده کاوي
1- 4 تعريف داده کاوي
1- 5 تاريخچه داده کاوي
1- 6 برخي از کاربردهاي داده کاوي در محيطهاي واقعي عبارتند از : 
1- 6- 1 خرده فروشي 
1- 6- 2 بانکداري 
1- 6- 3 بيمه 
1- 6- 4 پزشکي 
1- 7 مراحل فرايند کشف دانش از پايگاه داده ها 
1- 8 عملياتهاي داده کاوي 
1- 9 الگوريتمهاي داده كاوي
1- 10 مدل فرآيند دو سويه
1- 11 ساختن يك پايگاه داده داده كاوي
1-12 نتيجه گيری
فصل دوم: داده كاوي درمديريت ارتباط بامشتري 
2- 1 چكيده 
2- 2 مقدمه
2- 3 داده كاوي
2- 4 مديريت ارتباط با مشتري
2- 5 چرخه زندگي مشتري
2- 6 نتيجه گيري
فصل سوم: کاربردهای داده کاوی در کتابخانه ها و موسسات دانشگاهی
3- 1 چکیده 
3- 2 مقدمه
3- 3 پیشرفت در تکنولوژیهای داده پردازی
3- 4 عناصر داده کاوی
3- 5 فنون داده کاوی
3- 6 کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی
3- 7 مدیریت و خدمات کتابخانه
3- 8 مدیریت موسسات دانشگاهی
3- 9 تذکرات نهایی
فصل چهارم: كسب و كار هوشمند و داده كاوي 
4- 1 مقدمه
4- 2 تكامل تاثير گذاري داده ها 
4- 3 از داده ها تا تصميم گيريها
4- 4 مفهوم ذخيره داده ها 
4- 5 تعريفي براي داده كاوي 
4- 6 كاربردها و عمليات داده كاوي 
4- 7 لزوم داده كاوي 
4- 8 داده كاوي در مقابل پرس و جو ها در پايگاه هاي داده سنتي 
4- 9 الگوريتم هاي انجمني 
4- 10 تكنيكهاي مرتبط با داده كاوي 
4- 11 ابزارهاي داده كاوي 
4- 12 درخت هاي تصميم گيري 
4- 13 داده كاوي – يك مدل و نمونه خلاصه 
4- 14 نرم افزار Low end 
4- 15 فرآيند داده كاوي 
4- 16 نرمال سازي  
4- 17 يادگيري داده ها 
4- 18 درخت هاي تصميم گيري و قواعد تصميم گيري 
4- 19 نتيجه گيري 
فصل پنجم: تفاوت داده کاوی و آنالیز های آماری 
5- 1 مقدمه 
5- 2 روش آنالیز آماری 
5- 3 روش داده کاوی 
5- 4 فواید و نقش داده کاوی در فعالیت شرکتها  
5- 5 مراحل اصلی داده کاوی  
فصل ششم: داده كاوي توزيع شده 
6- 1 مقدمه 
6- 2 دلايل پيدايش داده کاوی توزيع شده 
6- 3 تکنيکها و رويکردها در داده کاوی توزيع شده 
6- 4 عاملها و داده کاوی توزيع شده 
6- 5 داده کاوی و حريم خصوصی 
6- 6 کاربرد‌هاي داده کاوي 
6- 7 تکنيک‌هاي داده کاوي 
6- 8 قوانين انجمني 
6- 9 تشخيص قوانين انجمني  به كمك الگوريتم apriori 
6- 10  فرآیند استخراج قوانین وابستگی 
Apriori Based DDM Algorithms 11- 6 
Count Distribution 12- 6 
Data Distribution 13- 6 
فصل هفتم: نرم افزار داده كاوي  Weka  
7-1 مقدمه 
7-2 روش استفاده از Weka 
3-7 قابليتهاي Weka 
4-7دريافت Weka 
              5-7 مروري بر Explorer 
فصل هشتم : نتيجه گيری و ارائه پيشنهادات 
              منابع

چكيده پایان نامه:
داده کاوی پل ارتباطی میان علم آمار، علم کامپیوتر، هوش مصنوعی، الگوشناسی، فراگیری ماشین و بازنمایی بصری داده می باشد. داده کاوی فرآیندی پیچیده جهت شناسایی الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده می باشد،  به طریقی که این الگو ها و مدلها برای انسانها قابل درک باشند.
داده کاوی به صورت یک محصول قابل خریداری نمی باشد، بلکه یک رشته علمی و فرآیندی است که بایستی به صورت یک پروژه پیاده سازی شود. 
داده ها اغلب حجیم می باشند و به تنهایی قابل استفاده نیستند، بلکه دانش نهفته در داده ها قابل استفاده می باشد. بنابراین بهره گیری از قدرت فرآیند داده کاوی جهت شناسایی الگوها و مدلها و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش نهفته در داده ها و نهایتا تبدیل داده به اطلاعات، روز به روز ضروری تر می شود. 
یکی از نمونه های بارز داده کاوی را می توان در فروشگاه های زنجیره ای مشاهده نمود، که در آن سعی می شود ارتباط محصولات مختلف هنگام خرید مشتریان مشخص گردد. فروشگاه های زنجیره ای مشتاقند بدانند که چه محصولاتی با یکدیگر به فروش می روند.
 
به روشنی این مطلب قابل درک است که این نوع استفاده از داده کاوی می تواند فروشگاه ها را در برگزاری هوشمندانه فستیوال های فروش و نحوه ارائه اجناس به مشتریان یاری رساند.
نمونه دیگر استفاده از داده کاوی در زمینه فروش را می توان در یک شرکت بزرگ دوبلاژ و تکثیر و عرضه فیلم های سینمایی در آمریکای شمالی مشاهده نمود که در آن عملیات داده کاوی ، روابط مشتریان و هنرپیشه های سینمایی و نیز گروه های مختلف مشتریان بر اساس سبک فیلم ها (ترسناک، رمانتیک، حادثه ای و …) مشخص گردید.
از دیگر زمینه های به کارگیری داده کاوی، استفاده بیمارستانها و کارخانه های داروسازی جهت کشف الگوها و مدلهای ناشناخته تاثیر دارو ها بر بیماری های مختلف و نیز بیماران گروه های سنی مختلف را می توان نام برد.
استفاده از داده کاوی در زمینه های مالی و بانکداری به شناخت مشتریان پر خطر و سودجو بر اساس معیارهایی از جمله سن، درآمد، وضعیت سکونت، تحصیلات، شغل و غیره می انجامد.
دانلود فایل

دانلود فایل”تحقیق داده کاوي و اکتشاف دانش”