我正在處理一個需要解析標籤的nlp項目。我有以下形式的多個標籤:一個字符串,它是一組元組。例如:將一組元組轉換爲值
'{(Entertainment (Adult), S), (Performing Arts, S), (Comedy Club, S), ($, S), (Comedy, P), (18+, S), (Plays & Shows, P)}'
但我希望它看起來像這樣:
{('Entertainment (Adult)', 'S'), ('Performing Arts', 'S'), ('Comedy Club', 'S'), ('$', 'S'), ('Comedy', 'P'), ('18+', 'S'), ('Plays & Shows', 'P')}
我試着用每this question literal_eval,但我得到一個無效的語法錯誤。我認爲這是因爲這個標籤是一個包含元組的元組,它包含的字符串不是作爲字符串轉換的,所以literal_eval會變得混亂(這裏只是猜測)。
我試着做一些bandaid-y字符串條和分割,但我無法得到一個解決方案,將動態地爲不同的標籤。
如果標籤包含逗號,括號?首先要正確生成列表不是更簡單嗎? –
標籤將始終採用相同的形式:一組包含兩個值的元組。另一個標記示例是'{(All Ages,S),($,S),(Alternative&Rock,S),(Concerts&Live Music,P)}' In []: – Daniel
我會嘗試首先逗號然後加入成對。 – Adirio