لزوم استفاده از روش داده‌کاوی متناسب با ویژگی‌های داده‌ها برای متغیرهای کیفیت آب
کد مقاله : 1117-IWWA
نویسندگان
الهام قائمی1، مسعود تابش *2، سارا نظیف3
1دانشگاه تهران
2آب و فاضلاب، محیط زیست/مهندسی عمران منابع آب استاد دانشگاه تهران
3دانشیار -دانشگاه تهران- پردیس دانشکده فنی- دانشکده مهندسی عمران
چکیده مقاله
کنترل کیفیت آب در روند تولید، انتقال، ذخیره و توزیع آب از طریق سخت افزارها و نرم افزارهای قابل اعتماد بسیار حائز اهمیت است. حسگرها، داده‌های مربوط به متغیرهای کیفیت آب را در فواصل زمانی کوتاه خوانده و ارائه می‌کنند. داده‌های استخراج شده لازم است به درستی داده‌کاوی شوند تا نتایج درست از تجزیه و تحلیل آن‌ها کسب شود. با داده‌کاوی الگوهای متفاوت در مجموعه داده‌ها شناسایی می‌شوند. ناهنجاری‌های موجود در داده‌های کیفیت آب ممکن است ناشی از مشکلات فنی یا رویدادهای واقعی باشند. برای شناسایی مناسب رویدادهای واقعی، استفاده از داده‌های قابل اعتماد و حذف عوامل پرت ضروری است. در این پژوهش از دو رویکرد برای پردازش متغیرهای کیفیت آب در یک شبکه آب شهری استفاده شده است. این روش‌ها شامل K-نزدیک‌ترین همسایگی (KNN) و جنگل جداسازی (IF) است. یافته‌ها نشان می‌دهد که الگوریتم KNN برای یافتن نقاط پرت در مجموعه‌ داده با ناهنجاری‌های عمومی مناسب است. در مقابل، روش IF می‌تواند داده‌های پرت محلی را به درستی تشخیص دهد.
کلیدواژه ها
متغیرهای کیفیت آب، داده‌کاوی، KNN، IF، داده پرت
وضعیت: پذیرفته شده