我有一個關於scikit-learn的問題。scikit-learn多維特徵
是否可以將多維特徵列表合併到一個特徵向量。 例如: 我有應用程序分析的結果,我想用一個特徵向量來表示一個應用程序。 在網絡流量的情況下,分析結果如下所示:
traffic = [
{
"http_body": "http_body_data", "length": 1024
},
{
"http_body2": "http_body_data2", "length": 2048
},
... and many more
]
所以在交通列表中的每個字典描述特定應用的一個網絡活動。
我想生成一個特徵向量,其中包含一個應用程序的所有這些信息,以便能夠從各種應用程序的分析結果中生成一個模型。
我該如何用scikit-learn做到這一點?
預先感謝您!
謝謝你的回答。 在我的真實數據集中,還有一些更多的特性,如每個流量事件的源/目標ip,源/目的端口,響應代碼等。所以即使http_lenght是相同的,也存在完全不同的字段。 是否有任何缺點,如果我生成這樣的特徵向量(不管什麼特徵是非常合理的): feature_vector_dict:{ 「http_length1」:1024,「http_body1」:「http_body_data」,「src_ip1」:「127.0。 0.1「,...,」http_length2「:2048,」http_body2「:」http_body_data2「,」src_ip2「:」127.0.0.1「,... } – user5594750