مقایسه سه الگوریتم درخت تصمیم، نزدیک ترین همسایه و شبکه های عصبی برای تشخیص کاربردهای پنهان نگار در جریان ترافیک شبکه اینترنت (مطالعه موردی:تشخیص نرم افزار تور وسایفون)
کد مقاله : 1162-HMM
نویسندگان:
1علی صادقی *، 2رضا حق مرام
1nhka[,
2عضو هیات علمی دانشگاه
چکیده مقاله:
با توجه به استفاده روز افزون ازشبکه اینترنت ولزوم وجود ابزارهایی جهت کنترل ومدیریت ترافیک شبکه‌ها ونیز پیدایش مداوم کاربردهایی که با استفاده از تکنیک هایی بدیع وپیچیده‌ی مبهم سازی قصد فریب این ابزارها رادارند، طراحی دقیق سیستم های شناسایی ودسته بندی کاربردهای مختلف شبکه ازاهمیت زیادی برخوردار است. در محیط های جدید ارتباطی و باتوجه به تغییر ترافیک ابزارها به صورت مبهم و رمز شده، روش های پیشین این حوزه (با استفاده از شماره درگاه و محتوا) کارایی خود را از دست داده اند. در این راستا ارائه روش های مبتنی بر یادگیری ماشین و استفاده از ویژگی های آماری جریان ها، پیشرفت های قابل ملاحظه ای در این حوزه ایجاد کرده است که کارایی هر چه بیشتر این دسته از روش ها را تضمین می کند. هدف این پایان نامه طراحی وپیاده سازی یک الگوریتم بهینه وکارا جهت شناسایی ودسته بندی ترافیک شبکه، مبتنی بر تکنیک های یادگیری ماشین واستخراج ویژگی است. ساخت چنین سیستمی شامل سه مرحله است: مرحله اول مربوط به ساخت مجموعه داده ومرحله دوم شامل اقدامات پیش پردازشی ازقبیل انتخاب ویژگی است. در مرحله سوم یعنی مرحله پردازش اصلی از الگوریتم‌های درخت تصمیم،K‌_نزدیک ترین همسایه از الگوریتم‌های یادگیری ماشین و پرسپترون چند لایه که یکی از الگوریتم‌های شبکه های عصبی است استفاده شده است.
در این پژوهش ازدو نرم افزار پنهان‌نگارTOR وPSIPHON برای تست الگوریتم استفاده کردیم.بهترین نتایج نشان از دقت 99.8درصدی برای تشخیص نرم‌افزار PSIPHON با استفاده از الگوریتم C4.5 ودقت تشخیص 99.6 درصد برای نرم‌افزار TOR با استفاده از شبکه عصبی mlp داشت.به طور میانگین الگوریتم C4.5 دقت بالاتری نسبت به دو الگوریتم دیگر دارد.
کلیدواژه ها:
تشخیص ترافیک، الگوریتم درخت تصمیم، k_ نزدیک‌ترین همسایه، ترافیک رمز شده، شبکه عصبی
وضعیت : مقاله پذیرفته شده است