我想在Weka中使用機器學習技術,例如樸素貝葉斯和SVM,以使用DNA序列數據識別物種。 問題是我必須將DNA序列轉換成數字向量。將DNA序列轉換爲R/Weka的數字向量
我的序列是這樣的:
------------------------------------ ------------ G ------------------------------------ ------ GGAGATG ------------------------------------------ GGAGATG ------------------------------------------GGAGATG TTATTAATTCGAGCAGAATTAGGAAATCCTGGATCTTTAATTGGTGATG - -------------------------------------------- ATG CTATTAATTCGAGCTGAGCTAAGCCAGCCCGGGGCTCTGCTCGGAGATG - --------------------- TCAACCTGGGGCCCTACTCGGAGACG ---- TAATCCGAGCAGAATTAAGCCAACCTGGCGCCCTACTAGGGGATG CTATTAATTCGAGCTGAGCTAAGCCAGCCTGGGGCTCTGCTCGGAGATG TTATTAATTCGTTTTGAGTTAGGCACTGTTGGAGTTTTATTAG --- ATA
我怎樣才能做到這一點?除Weka以外的其他任何關於用DNA序列進行ML的程序的建議?