0
我有從多個PCAP文件獲取的請求的數據集,並已將這些PCAP文件加載到R.每個PCAP文件有效地引用單個觀察(行)。令牌化SQL注入字符串
在這個數據集中有一個「請求」列,它給出了一個關於源請求的字符串。例如,請求可能會顯示爲:
http://111.22.33.1/ilove/usingR/extraextra/sqli/?id='or1=1--
我想標記每個請求字符串以便在其上運行一些機器學習算法。對這些字符串進行標記的最好方法是什麼,以便對其進行一些分析?我知道存在諸如tm
這樣的軟件包,但對它們沒有什麼經驗。
看一下'urltools'包,如果解析工具有任何不足,請讓我知道您需要增強哪些內容。 – hrbrmstr
你能給出更實際的輸入和輸出嗎? –