حملات باج افزار یکی از خطرناک ترین جنایات مرتبط در بازار سکه است. برای افزایش چالش مبارزه با حمله ، تشخیص زودهنگام باج افزار ضروری به نظر می رسد. در این مقاله ، ما یک سیستم پیش بینی کننده معامله بیت کوین با کارایی بالا را پیشنهاد می کنیم که معاملات پرداخت بیت کوین را برای یادگیری الگوهای داده ای که می تواند پرداخت های باج افزار را برای شبکه های ناهمگن بیت کوین در معاملات مخرب یا خوش خیم تشخیص و طبقه بندی کند ، بررسی می کند. رویکرد پیشنهادی از سه روش یادگیری ماشین نظارت شده برای یادگیری الگوهای متمایز در معاملات پرداخت بیت کوین ، یعنی رگرسیون لجستیک (LR) ، جنگل تصادفی (RF) و تقویت شیب شدید (XGBoost) استفاده می کند. ما این مدل های پیش بینی مبتنی بر ML را در مجموعه داده باج افزار Bitcoinheist از نظر صحت طبقه بندی و سایر اقدامات ارزیابی مانند ماتریس سردرگمی ، فراخوان و F 1-نمره ارزیابی می کنیم. معلوم شد که نتایج تجربی ثبت شده توسط مدل XGBoost به دقت 99. 08 ٪ رسیده است. در نتیجه ، دقت مدل حاصل بالاتر از بسیاری از مدلهای پیشرفته اخیر است که برای تشخیص پرداخت باج افزار در معاملات بیت کوین تهیه شده است.
1. معرفی
اشکال مختلف ارز دیجیتال طی دهه ها پیشنهاد و اجرا شده است. فناوری blockchain اجازه می دهد تا با استفاده از الگوریتم اجماع مبتنی بر اثبات کار ، ارز غیر متمرکز وجود داشته باشد و معاملات قابل اعتماد را انجام دهد.
بیت کوین اکنون به دلیل عدم تنظیم و مجرمان نیز مورد توجه محققان و سرمایه گذاران قرار گرفته است.
به تازگی ، اینترنت با موجی از انواع جدید بدافزار ، طبقه بندی شده به عنوان باج افزار ، این نوع بدافزار است که به محض اینکه با موفقیت سیستم رایانه ای یک هدف را آلوده می کند ، پس از آن پرونده ها و داده های خصوصی را رمزگذاری می کند تا قربانی دیگر نتواندبه آنها دسترسی پیدا کنید. سپس قربانی با پیامی توضیح می دهد که اوضاع را توضیح می دهد و شامل دستورالعمل هایی در مورد نحوه دسترسی کامل به سیستم خودشان است و این معمولاً شامل پرداخت مبلغ پول از طریق بیت کوین است.
چندین گروه و انواع هکر وجود دارد که به عنوان خانواده ها نیز شناخته می شوند ، از این بدافزار ، اما ویژگی تعیین کننده آنها برای آزاد کردن دسترسی به داده های ضبط شده باید پرداخت کند [3].
ما پیشنهاد می کنیم چندین معاملات جمع آوری شده از blockchain بیت کوین را تجزیه و تحلیل کنیم تا مشخص شود که آیا می توان به راحتی هر معامله را به عنوان متعلق به یک خانواده باج افزار طبقه بندی کرد یا خیر. از آنجا که پرداخت cryptocurrency ناشناس است ، بنابراین پیدا کردن چه کسی آنها را ارسال کرده یا هنگامی که آنها ساخته شده اند چالش برانگیز است. بنابراین ، برای اینکه بتوانیم این معاملات را به درستی بشناسیم و طبقه بندی کنیم ، بسیار مهم است که آنها با توجه به مبادلات قانونی یا عملیات معاملاتی مشخص و برچسب گذاری شوند.
برای تعیین اینکه آیا یک معامله مخرب یا خوش خیم است ، از مدل های یادگیری ماشین (ML) در این مقاله استفاده می شود [2 ، 4 ، 5]. برای طبقه بندی انواع مختلف معاملات مخرب در بیت کوین ، از مجموعه داده باج افزار Bitcoinheist استفاده کردیم. ویژگی های مختلف معامله مورد تجزیه و تحلیل قرار می گیرد. دقت ، دقت و فراخوان نتایج ارزیابی می شود.
مشارکتهای اصلی این مقاله را می توان به شرح زیر خلاصه کرد: (i) نشان می دهد که چگونه تعادل داده ها در مدل های پیش بینی مبتنی بر ML برای طبقه بندی باج افزار معاملات بیت کوین تأثیر می گذارد (II) تشخیص ناهنجاری ها قبل از آموزش مدل (III) و ارزیابی لجستیکرگرسیون (LR) ، جنگل تصادفی (RF) و روشهای تقویت شیب شدید (XGBOOST) برای یادگیری الگوهای متمایز در معاملات پرداخت بیت کوین
بقیه مقاله به شرح زیر سازماندهی شده است: بخش 2 بررسی ادبیات مربوط به تجزیه و تحلیل و شناسایی باج افزار را ارائه می دهد. بخش 3 در مورد مدل سازی و مشخصات سیستم ما بحث می کند. نتایج و مطالعه عملکرد در بخش 4 ارائه شده است. سرانجام ، نتیجه گیری و دستورالعمل های آینده کار تحقیق در بخش 5 ارائه شده است.
2. کار مرتبط
با افزایش سریع فعالیت بیت کوین ، چندین مطالعه فناوری blockchain را از زوایای مختلف تجزیه و تحلیل کرده اند [6].
اولین تحولات با هدف یافتن سکه های مورد استفاده در فعالیت های غیرقانونی ضمن دنبال کردن شبکه معامله [7-9].
شناسایی کاربر برای پیوستن به شبکه لازم نیست زیرا بیت کوین ناشناس بودن شبه را فراهم می کند. نویسندگان در [10] یک طرح اختلاط را برای پنهان کردن جریان سکه در شبکه پیشنهاد دادند. محققان فاش کردند که برخی از پرداخت های بیت کوین را می توان ردیابی کرد [11].
در تجزیه و تحلیل باج افزار ، چندین محقق شبکه های باج افزار cryptocurrency را تجزیه و تحلیل کرده اند [12 ، 13]. آنها دریافتند که رفتار هکر می تواند به ما در شناسایی پرداختهای باج افزار ناشناخته کمک کند.
مطالعات اولیه در تشخیص باج افزار از قانون تصمیم گیری در مورد مبالغ و زمان معاملات باج افزار شناخته شده برای یافتن پرداختهای باج افزار ناشناخته استفاده می کند [14].
مطالعات اخیر تلاشهای مشترک بین محققان و شرکتهای تحلیلی blockchain است. در [13] ، آنها رفتار هکر مشترک را شناسایی کردند و از اکتشافی برای تعیین پرداخت باج افزار استفاده کردند. نویسندگان تخمین می زنند که بیش از 20،000 قربانی پرداخت باج افزار را انجام داده اند.
در [4] ، نویسندگان تفاوتهای بین خانواده های باج افزار در رفتار تجارت بیت کوین را با استفاده از تجزیه و تحلیل آماری توصیفی مورد مطالعه قرار دادند. در [15] ، نویسندگان از درختان تصمیم گیری و یادگیری گروه برای طبقه بندی خانواده های باج افزار استفاده کردند. در [16] ، نویسندگان رویکردی به نام NetConver را برای تجزیه و تحلیل باج افزار در ترافیک شبکه با استفاده از مدل Tree Tree (DT ، J48) پیشنهاد کردند. آنها به میزان دقت 97. 1 ٪ رسیدند. این آثار تحقیقاتی عمدتاً در تشخیص باج افزار قبل از اینکه بتوانند یک سیستم را آلوده کنند و معاملات بیت کوین را در نظر نگیرند ، هدف قرار گرفته اند.
3. روش شناسی
3. 1مجموعه داده تراکنش بیت کوین
مجموعه داده های مورد استفاده برای این مطالعه توسط [17] ارائه شده است و در حال حاضر در مخزن یادگیری ماشین UCI موجود است. این میزبان دانشگاه کالیفرنیا در ایروین است [18]. هر سطر یک معامله blockchain بیت کوین را نشان می دهد و شامل مجموعه ای از ویژگی های زیر است [17]: (i) آدرس: رشته ای که آدرس معامله را توصیف می کند (ب) سال: عدد صحیح که سال معامله را توصیف می کند (iii) روز: عدد صحیحتوصیف روز معامله (IV) طول: تعداد معاملات غیر استارتر در طولانی ترین زنجیره آن (V) شمارش: تعداد مبتدیان معامله ای که به همسایگان آدرس (vi) مرتبط هستند: تعداد معامله هایی که این آدرس را دارندوزن خروجی (VII): مجموع کسری از سکه های بیت کوین که از یک معامله شروع کننده ناشی می شوند و به این آدرس (viii) می رسند حلقه شده: تعداد معاملات استارت که توسط بیش از یک مسیر مستقیم به این آدرس وصل می شود (ix) درآمد: عدد صحیح که مقدار Satoshi را ذخیره می کند (بیت کوین = 100 میلیون Satoshi. Satoshi کوچکترین واحد بیت کوین است) (x) برچسب: رشته ای که ماهیت معامله را نشان می دهد (باج افزار: 29 خانواده و سفید: قانونی)
میز 1 آمار مجموعه داده های معاملات بیت کوین.
مشخصات مجموعه داده ها در جدول 1 ارائه شده است. به نظر می رسد توزیع ضبط بین خانواده های باج افزار تقریباً متعادل است ، با 13163 رکورد برای اول ، 12،402 رکورد برای دوم و 15. 848 رکورد برای خانواده سوم.
ویژگی های استخراج شده از مجموعه داده به شرح زیر است: (i) تعداد نمونه های هر ستون (ii) میانگین هر ستون (iii) انحراف استاندارد هر ستون (IV) حداقل هر ستون (v) حداکثراز هر ستون
طبق جدول 1 ، معاملات مجموعه داده ها 28 خانواده را به شرح زیر تقسیم می کنند: (i) 3 دسته باج افزار پرینستون ، مونترال و پادوا هستند. آنها حاوی 27 خانواده هستند.(ب) 1 دسته سفید که نشان دهنده معاملات قانونی است
3. 2مدل سازی سیستم
برای تولید یک مدل پیش بینی کننده از باج افزار و طبقه بندی معاملات بیت کوین ، به نظر می رسد تعامل الگوریتم های ML تحت نظارت (MLA) [19] ضروری است.
ما نگران طراحی یک طرح طبقه بندی متکی به یادگیری مبتنی بر یادگیری هستیم که از پیش پردازش ، تعادل ، طبقه بندی و ارزیابی استفاده می شود.
سیستم توسعه یافته از چهار مرحله تشکیل شده است ، همانطور که در شکل 1 نشان داده شده است.
بهترین استراتژی معاملات...
ما را در سایت بهترین استراتژی معاملات دنبال می کنید
برچسب :
نویسنده : صدرا ذوالریاستین
بازدید : 36
تاريخ : چهارشنبه
18 مرداد
1402 ساعت: 20:24