例如,我有一個數據框,其中包含跨類別和子類別的數據,我希望能夠在特定列中獲得具有最大值的行。如何在R數據框上執行SQL操作?
SQL是首先想到的。但是因爲我對連接或索引等不感興趣,所以python的列表解析會用更現代的語法更好地完成同樣的事情。
R對這些操作的最佳做法是什麼?
編輯: 現在我認爲我很好,which.max
。爲什麼我問這個問題,我所做的只是簡單地告訴我,在R中有很多類庫,它們的功能都差不多。僅僅通過閱讀文檔,就很難評估它的流行程度(即圖書館如何實現其目的)。我個人使用Python的經驗是,當你弄清楚如何使用列表解析(itertools
作爲獎勵)時,你幾乎可以覆蓋。隨着時間的推移,這已經演變爲最佳實踐,你不會看到lambda
和filter
,例如在目前一般python辯論中經常出現的情況,因爲列表解析可以更簡單,更統一。
我懷疑這是有點太模糊。 R中的最佳實踐將取決於您尋求的特定數據摘要以及數據的排列方式。對於你的一個具體例子總是有'which.max'。 – joran