• Skip to primary navigation
  • Skip to main content
  • Skip to primary sidebar
Office 指南

Office 指南

辦公室工作實用教學

  • Excel
  • Word
  • PowerPoint
  • Windows
  • PowerShell
  • R

R 合併重複名稱的列,加總各欄位值教學

介紹如何使用 R 的 dplyr 套件,將 data frame 重複的名稱的列合併,加總各欄位值。


假設我們有一張 data frame 表格,資料如下:

# 原始資料
df <- data.frame(
  x = c("A","B","A","B", "B"),
  y = 1:5,
  z = 2:6
)
df
  x y z
1 A 1 2
2 B 2 3
3 A 3 4
4 B 4 5
5 B 5 6

若想要將表格中的資料依據 x 欄位合併,將相同名稱的列合併為一列,其餘的數值欄位以加總的方式合併,這種狀況就可以使用 dplyr 套件來處理。

首先安裝並載入 dplyr 套件:

# 安裝 dplyr 套件
install.packages("dplyr")

# 載入 dplyr 套件
library(dplyr)

接著將 data frame 以 group_by 分組之後,再以 summarise_all 配合 sum 以加總的方式合併重複的列:

# 分組加總
df %>%
  group_by(x) %>%
  summarise_all(sum)
# A tibble: 2 x 3
  x         y     z
  <fct> <int> <int>
1 A         4     6
2 B        11    14

若要以平均值的方式合併重複的列,可將 sum 函數替換為 mean:

# 分組計算平均
df %>%
  group_by(x) %>%
  summarise_all(mean)
# A tibble: 2 x 3
  x         y     z
  <fct> <dbl> <dbl>
1 A      2     3
2 B      3.67  4.67

若要同時以加總與平均值的方式合併重複列,可以同時將 sum 與 mean 函數傳入 summarise_all 中:

df %>%
  group_by(x) %>%
  summarise_all(list(sum = sum, mean = mean))
# A tibble: 2 x 5
  x     y_sum z_sum y_mean z_mean
        
1 A         4     6   2      3   
2 B        11    14   3.67   4.67

參考資料:Biostars

分類:R

讀者互動

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Primary Sidebar

搜尋

分類

Android Apple C/C++ Excel Linux OneNote PHP PowerPoint PowerShell Python R Windows Word 免費工具 創客 網站架設 線上工具 資料庫 遊戲 雜七雜八

近期文章

  • Linux 使用 bpytop 監控系統資源狀態教學
  • Windows 工作排程器:每天自動關機教學與範例
  • Python 使用 openpyxl 模組讀取、寫入 Excel 檔案教學與範例
  • Python 使用 humanize 模組將數字轉為容易閱讀格式教學與範例
  • iOS 捷徑教學:充電時朗讀電量提示聲
  • 舊健保卡網路申請補發新卡教學
  • Linux 設定 Swap 記憶體交換空間優先值教學與範例
  • ITK 以 LabelStatisticsImageFilter 套用遮罩影像計算統計量教學與範例

推薦網站

  • Udemy 線上教學課程
  • Coursera 線上教學課程

關注本站

  • 電子郵件
  • Facebook

Copyright © 2020 · Office Guide