感謝@hrbrmstr對於「Scraping a xml document (nested url-structure)」問題,我得到了一個很好的解決方案。將唯一值轉換爲新列並檢查所有其他值
但是從有識之士因此,出現了另一個問題:
現在我已經得到了以下數據結構...
$Vorname : chr "Jan" "Jan" "Jan" "Jan" ...
$ Nachname : chr "Aken" "Aken" "Aken" "Aken" ...
$ ID : chr "1627" "1627" "1627" "1627" ...
$ Fraktion : chr "Die Linke" "Die Linke" "Die Linke" "Die Linke" ...
$ Reli : chr "" "" "" "" ...
$ Geschlecht: chr "Männlich" "Männlich" "Männlich" "Männlich" ...
$ Auss_ord : chr "Auswärtiger Ausschuss" "Gremium nach § 23c Absatz 8 des Zollfahndungsdienstgesetzes" "Verteidigungsausschuss" "Unterausschuss Abrüstung, Rüstungskontrolle und Nichtverbreitung" ...
這實際上是斕「Auss_ord」唯一的變數其中包含價值不同的國會議員佣金。
現在,我想要的是從當前的長版本切換到寬的數據幀版本。
對於「Auss_ord」中的每個唯一值(某些文本字符串),應該有一個新列,並且如果它是「True」,則會檢查另一個對象是否具有相同值。
這樣......
Vorname Nachname ID Fraktion Reli Geschlecht Auss_ord
<chr> <chr> <chr> <chr> <chr> <chr> <chr>
1 Jan Aken 1627 Die Linke Männlich Auswärtiger Ausschuss
2 Jan Aken 1627 Die Linke Männlich Gremium nach § 23c Absatz 8 des Zollfahndungsdienstgesetzes
3 Jan Aken 1627 Die Linke Männlich Verteidigungsausschuss
4 Jan Aken 1627 Die Linke Männlich Unterausschuss Abrüstung, Rüstungskontrolle und Nichtverbreitung
5 Stephan Albani 1769 CDU/CSU Männlich Ausschuss für Bildung, Forschung und Technikfolgenabschätzung
6 Stephan Albani 1769 CDU/CSU Männlich Ausschuss für Gesundheit
7 Katrin Albsteiger 1770 CDU/CSU römisch-katholisch Weiblich Schriftführer/in
8 Katrin Albsteiger 1770 CDU/CSU römisch-katholisch Weiblich Ausschuss für die Angelegenheiten der Europäischen Union
...應該變成...
Example Dataframe (wide version)
我試着像
d1 <- dcast(df, Vorname ~ Nachname ~ ID ~ Fraktion ~ Reli, value.var="ausord")
或
重塑業務d2 <- reshape(df, idvar = "ID", timevar = "Auss_ord", direction = "wide")
...但我沒有得到任何正確的結果,除了(對我來說)真正棘手執行檢查的值的唯一性
這裏是[如何使一個可重複的例子](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example/5965451#5965451),一個數據幀會比'str'的輸出更好。 –