نوشته‌ها

دسترسی به اعضا – قسمت سوم – شناسایی داده های پرت outlier از طریق Clustering

یک روش دیگر برای شناسایی داده‌های پرت، استفاده از روش کلاسترده‌ای (Clustering) مانند K-Means یا DBSCAN است. در این روش، ابتدا داده‌ها را به خوشه‌های مختلف تقسیم می‌کنیم و سپس نقاطی که به هیچ خوشه‌ای تعلق ندارند یا از بقیه نقاط در خوشه فاصله زیادی دارند را به عنوان داده‌های پرت شناسایی می‌کنیم.