Skip to content

Latest commit

 

History

History
60 lines (39 loc) · 1.59 KB

README.md

File metadata and controls

60 lines (39 loc) · 1.59 KB

Feature Engineering 설명

URL 데이터로부터 추출된 각 feature에 대한 설명을 포함합니다.

Length Features

URL Length

  • URL의 전체 길이를 나타냅니다.

Hostname Length

  • 도메인 이름의 길이를 나타냅니다.

Path Length

  • URL 경로의 길이를 나타냅니다.

First Directory Length

  • URL 경로에서 첫 번째 디렉토리의 길이를 나타냅니다.

Top Level Domain (TLD) Length

  • Top Level Domain (TLD)의 길이를 나타냅니다.

Count Features

Special Symbols Count

  • URL에서 특수 기호의 수를 계산합니다.

Digit Count

  • URL에서 숫자의 수를 계산합니다.

Alphabet Count

  • URL에서 알파벳의 수를 계산합니다.

Directory Count

  • URL 경로에서 디렉토리의 수를 계산합니다.

Other Features

Use of IP Address

  • URL에 IP 주소가 포함되어 있는지 여부를 나타냅니다.

Short URL

  • URL이 단축 URL인지 여부를 나타냅니다.

URL Has File Extension

  • URL이 파일 확장자를 포함하는지 여부를 나타냅니다.

URL Has Email Address

  • URL이 이메일 주소를 포함하는지 여부를 나타냅니다.

Length Ratios

  • URL의 다양한 요소(도메인, 경로, 파라미터 등)의 길이와 전체 URL의 길이에 대한 비율을 계산합니다.

Suspicious Word Count

  • URL에서 의심스러운 단어의 수를 계산합니다.

Use of HTTPS

  • URL이 HTTPS 프로토콜을 사용하는지 여부를 나타냅니다.

Use of HTTP

  • URL이 HTTP 프로토콜을 사용하는지 여부를 나타냅니다.