داده کاوی (Data mining) فرایند تجزیه و تحلیل حجم عظیمی از داده ها برای کشف هوش تجاری است. داده کاوی به سازمان ها در حل مشکلات، کاهش خطرات و استفاده از فرصت های جدید کمک می کند.
الگوریتم c 4.5: یکی از الگوریتم های داده کاوی الگوریتم های طبقه بندی است که با استفاده از درخت تصمیم گیری یک جدا کننده ایجاد می کند. برای این کار از دیتا ستی که قبلا دستهبندی شده، استفاده میشود.
تشخیص دادههای پرت در اکسل با کمک فرمول ها و فرمت دهی شرطی به راحتی و با دقت بالایی بصورت بصری و با کمک روش چارک ها صورت می گیرد. یکی از مراحل پروژه های داده کاوی و علم داده پیش پردازش داده ها می ...
متخصص داده کاوی، داده های ثبت شده در کسب و کار کارفرما را از وی درخواست می کند و ... این مدلها به فرمهایی از درخت تصمیم، یا فرمولهای ریاضی نمایش داده میشود. مجموعه دادههای آموزشی از ...
در این مقاله از سری مقالات مجله پی استور به توضیح و تشریح دادهکاوی و انواع الگوریتمهای آن می پردازیم و مباحث مهم از کاربرد تا چالشهای آن را مورد بررسی قرار میدهیم.
طبقه بندی در داده کاوی. طبقه بندی در داده کاوی Classification : یکی از دانش هایی که در عصر حاضر بسیار مورد استقبال قرار گرفته داده کاوی است. به طور کلی به معنای کاوش در داده ها است که به اشکال مختلف برای به دست آوردن الگوها و ...
از مهمترین تکنیکهای عملی دادهکاوی که کاربرد زیادی در علوم مختلف دارد، می توان به «خوشه بندی k-میانگین» (K-means Clustering) اشاره کرد، که با توجه به بار محاسباتی زیاد آن، استفاده از کامپیوتر در انجام این فرآیند، کمک شایانی ...
بخش اول شامل مقدمات دادهکاوی و روشهای خوشهبندی است، بخش دوم شامل رگرسیون، روشهای طبقهبندی، روشهای کاهش ابعاد و قواعد انجمنی است.
در مبحث دادهکاوی، گاهی به ماتریس مشابهت، «ماتریس مجاورت» (Proximity Matrix) نیز میگویند. معمولا برای اندازهگیری عدم مشابهت بین دو سری داده، فاصله آنها را محاسبه میکنند. ... مجموعه آموزش های ...
معرفی بهترین الگوریتمهای داده کاوی. کلاس بندی (Classification) و خوشه بندی (Clustering) روش هایی هستند که برای تحلیل دادهها به کار میروند.
رابطه این روش یعنی فرمول بهدست آوردن اطلاعات در ادامه نمایش داده شده است: ... در بخش بعدی این مقاله، پس از معرفی مجموعه دورههای آموزش داده کاوی و یادگیری ماشین، به بررسی انواع درخت تصمیم در ...
به مجموعهای از روشهای قابل اعمال بر پایگاه دادههای بزرگ و پیچیده به منظور کشف الگوهای پنهان و جالب توجه نهفته در میان دادهها، دادهکاوی گفته میشود. روشهای دادهکاوی تقریبا همیشه به لحاظ محاسباتی پر هزینه هستند. علم میانرشتهای دادهکاوی، پیرامون ابزارها، متدولوژیها و تئوریهایی است که برای آشکارسازی الگوهای موجود در دادهها مورد استفاده قرا...
داده کاوی یا دیتا ماینینگ در واقع علمی میان رشته ای است که علوم کامپیوتر، هوش مصنوعی، یادگیری ماشین، ریاضی و آمار را دربر می گیرد. با ساخت فرآیند داده کاوی، می توان دیتاهای حجیم و پیچیده سازمان ها و مؤسسات تحقیقاتی را ...
الگوریتمهای متنوع و زیادی برای انجام عملیات خوشهبندی در دادهکاوی به کار میرود. آگاهی از الگوریتمهای خوشهبندی و آشنایی با نحوه اجرای آنها کمک میکند تا مناسبترین روش را برای خوشهبندی دادههای خود به کار ...
به زبان سادهتر، داده کاوی فرایند استخراج دادههای قابل استفاده از بین حجم عظیمی از دادههای خام می باشد. در data mining، الگوی بین دادهها توسط چندین نرم افزار تجزیه و تحلیل میشود.
توابع زیادی برای اندازهگیری فاصله بین اشیاء، با ویژگیهای کمی وجود دارد. «توابع فاصله» (Distance Functions) در تکنیکهای دادهکاوی بخصوص در خوشهبندی، کاربردهای زیادی دارند. در این متن ابتدا به معرفی خصوصیات تابع فاصله ...
با درختهای تصمیم در درس گذشته آشنا شدید. الگوریتم ID3 یکی از الگوریتمهای پایه برای ساختِ درختهای تصمیم است. همانطور که در درس گذشته گفتیم، در یک درخت تصمیم، مهم است که کدام یک از ویژگیها (یا همان ابعاد) را در سطوح ...
فرمول کلی MinMaxNormalization برای تبدیل دادهها به بازهی بین ۰ تا ۱ به صورت زیر است: ... عملیات نرمالسازی قبل از بسیاری از الگوریتمهای دادهکاوی مانند شبکههای عصبی، SVM، KNN و KMeans بایستی انجام ...
ماشین بردار پشتیبان یکی از الگوریتمهای نظارتشده یادگیری ماشین است. بسیاری از افراد در ابتدا هنگامی که نام این الگوریتم را میشنوند تصور میکنند با یک الگوریتم بسیار پیچیده مواجه هستند که درک آن دشوار است. این در ...
دادهکاوی به سازمانها امکان میدهد تا از دادههای خام و حجیم، اطلاعات مفید و دانش ارزشمندی استخراج کنند که میتواند به تصمیمگیریهای استراتژیک کمک کند.
«دادهکاوی» (Data Mining)، علمی میانرشتهای شامل الگوریتمهای «یادگیری ماشین» (Machine Learning)، روشهای آماری و «سیستمهای مدیریت پایگاه داده» (Database Management Systems) به شمار میآید.
روشهای اصلی داده کاوی به سه دسته کلی تقسیم میشوند: توصیفی و پیشگویی و تجویزی. این سه گروه، بیانگر اهداف و عملکرد روشهای داده کاوی نیز هستند.
الگوریتمها در دادهکاوی معمولاً مراحل مشخصی را اجرا میکنند تا اطلاعات مهم و قابل استفاده را از دادهها استخراج کنند. انواع الگوریتم های داده کاوی. الگوریتمهای دستهبندی (Classification algorithms):
داده کاوی چیست؟ دادهکاوی (Data Mining) فرآیند کشف الگوها، ارتباطات و اطلاعات مفید از میان حجم بزرگی از دادهها است. این فرآیند با استفاده از تکنیکهای مختلف آماری، الگوریتمهای یادگیری ماشین و ...