2015-11-02 59 views
0

我使用Movielens數據集來構建原型推薦系統。但爲了導入每部電影的類別,我需要在密碼中處理不同大小的行。 例如密碼 - 處理不同大小的行

;1;Toy Story (1995);Animation|Children's|Comedy 
;2;Jumanji (1995);Adventure|Children's|Fantasy 
;3;Grumpier Old Men (1995);Comedy|Romance 
;4;Waiting to Exhale (1995);Comedy|Drama 
;5;Father of the Bride Part II (1995);Comedy 

每個電影的具有一個或多個類別。我如何處理這種類型的行?

我想過把分隔符改爲「|」然後以某種方式從行[3]迭代到行[n]。

但我怎麼知道'n',以及如何到達那裏?

回答

1

使用分隔符|,您可以拆分類別,然後合併每個類別。 對於示例 -

UNWIND split(row.categories, "|") AS category 
MERGE (c:Category { name: category }) 
MERGE (movie)-[:CATEGORY]->(c) 
+0

我得到未定義 '行' 的錯誤,當我運行此查詢 - LOAD CSV從 「文件:/ C:/1m/movies.csv」 AS行 開卷分(行[3 (m) - [:HAS_GENRE] - >(c)合併(m:Movies {MovieID:row [1]}) 合併 – goelakash

+1

添加WITH行:從「...」加載CSV行字段終止符「;」排放鬆... – Luanne