لزوم استفاده از روش دادهکاوی متناسب با ویژگیهای دادهها برای متغیرهای کیفیت آب |
کد مقاله : 1117-IWWA |
نویسندگان |
الهام قائمی1، مسعود تابش *2، سارا نظیف3 1دانشگاه تهران 2آب و فاضلاب، محیط زیست/مهندسی عمران منابع آب استاد دانشگاه تهران 3دانشیار -دانشگاه تهران- پردیس دانشکده فنی- دانشکده مهندسی عمران |
چکیده مقاله |
کنترل کیفیت آب در روند تولید، انتقال، ذخیره و توزیع آب از طریق سخت افزارها و نرم افزارهای قابل اعتماد بسیار حائز اهمیت است. حسگرها، دادههای مربوط به متغیرهای کیفیت آب را در فواصل زمانی کوتاه خوانده و ارائه میکنند. دادههای استخراج شده لازم است به درستی دادهکاوی شوند تا نتایج درست از تجزیه و تحلیل آنها کسب شود. با دادهکاوی الگوهای متفاوت در مجموعه دادهها شناسایی میشوند. ناهنجاریهای موجود در دادههای کیفیت آب ممکن است ناشی از مشکلات فنی یا رویدادهای واقعی باشند. برای شناسایی مناسب رویدادهای واقعی، استفاده از دادههای قابل اعتماد و حذف عوامل پرت ضروری است. در این پژوهش از دو رویکرد برای پردازش متغیرهای کیفیت آب در یک شبکه آب شهری استفاده شده است. این روشها شامل K-نزدیکترین همسایگی (KNN) و جنگل جداسازی (IF) است. یافتهها نشان میدهد که الگوریتم KNN برای یافتن نقاط پرت در مجموعه داده با ناهنجاریهای عمومی مناسب است. در مقابل، روش IF میتواند دادههای پرت محلی را به درستی تشخیص دهد. |
کلیدواژه ها |
متغیرهای کیفیت آب، دادهکاوی، KNN، IF، داده پرت |
وضعیت: پذیرفته شده |