Skip to content

Seonghn/MalwareDetection-ML

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

34 Commits
 
 
 
 
 
 
 
 

Repository files navigation

안드로이드 악성 앱 탐지 프로젝트

서론

image

스마트폰, 태블릿과 같은 모바일 기기가 대중화됨에 따라 모바일 기기 사용자들을 대상으로 개인정보 탈취, 저작권 침해 등 여러 보안 위협이 증가 최근 2019년 미국표준기술연구소(NIST)가 공개한 ‘국가취약점 데이터베이스(NVD)’를 보면 2019년 한해 가장 많은 보안 취약점이 발견된 운영체제는 구글 안드로이드로 총 414건이었다. 이처럼 많은 취약점 존재하기 때문에 다수 공격자들의 타겟이 될 가능성이 높다. 많은 안드로이드 사용자들이 공식적으로 검증되지 않은 악성 앱들을 블랙마켓 등 여러 불법 앱 마켓에서 다운받아 사용한다. 이에 따라, 본 프로젝트에서는 기하급수적으로 불어나는 안드로이드 악성 앱들에 대처하기 위해 머신러닝 기법을 이용한 악성 앱 탐지 시스템을 제안한다.

악성 앱 탐지 시스템 진행사항

  • 악성 앱 데이터셋

  • 악성 행위에 사용되는 API 목록 생성

  • 데이터셋 전처리 (CSV 파일 생성)

  • 모델 생성

  • 모델 검증 및 테스트

  • 결론 및 한계점

데이터셋

추출 도구

악성 행위에 사용되는 API 목록 생성

  • 참고 논문 출처

    Yousra Aafer, Wenliang Du, and Heng Yin(2014) "DroidAPIMiner: Mining API-Level Features for Robust Malware Detection in Android." International conference on security and privacy in communication systems, Springer.

  • 위험 API 목록 (1,848 개)

image

  • 위험 API 목록 정제 (1,848 → 137 개)

image

사용 빈도에 따라 위험 API 목록의 개수를 줄임 (용량, 차원 감소)

- 하지만 사용 빈도에 따른 feature selection은 과적합의 요인이 될 수 있다고 판단

  따라서, 2가지 데이터셋 생성
  
   1. '정제 전 API 목록'으로 생성한 데이터셋
   
   2. '정제 후 API 목록'으로 생성한 데이터셋

데이터셋 전처리

  • class
  1. training & validation set
정상 앱 : Androzoo 19,453 apks

악성 앱 : AMD 19,453 apks
  1. testing set
정상 앱 : Androzoo 5,501 apks (중복 아님)

악성 앱 : Drebin 5,501 apks
  1. '정제 전 API 목록'으로 생성한 데이터셋

image

  1. '정제 후 API 목록'으로 생성한 데이터셋

image

모델 생성

image

  • LightGBM

    RandomForest와 k-NN을 사용한 모델보다 LGBM이 더 뛰어난 성능을 보여줌

    Azure Machine Learning Studio 사용

    image

  • 실제 모델 구현

image

모델 검증 및 테스트

  • 모델 검증

1.1) '정제 전 API 목록'으로 생성한 데이터셋

image image

1.2) 정확도

image

  1. '정제 후 API 목록'으로 생성한 데이터셋

image image

2.2) 정확도

image

결론

  1. 정적으로 추출한 API들로도 높은 성능으로 악성 앱들을 구분 가능

  2. 특징정보를 축소시킨 경우에도 충분히 높은 성능을 보여줌

    • 데이터셋 크기 감소
    • 차원 축소로 인한 모델의 분류 속도 향상

한계점

  1. 동적 탐지보다 속도는 빠르지만 탐지에 한계

  2. 현재 가지고있는 데이터셋의 연도차에 대한 한계

  3. AMD와 Drebin 데이터셋이 판단하는 악성 앱의 기준이 다를 수 있음

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published