• 跳至主要導覽
  • 跳至主要內容
  • 跳至主要資訊欄
Office 指南

Office 指南

辦公室工作實用教學

  • Excel
  • Word
  • PowerPoint
  • Windows
  • PowerShell
  • R

R 合併重複名稱的列,加總各欄位值教學

介紹如何使用 R 的 dplyr 套件,將 data frame 重複的名稱的列合併,加總各欄位值。


假設我們有一張 data frame 表格,資料如下:

# 原始資料
df <- data.frame(
  x = c("A","B","A","B", "B"),
  y = 1:5,
  z = 2:6
)
df
  x y z
1 A 1 2
2 B 2 3
3 A 3 4
4 B 4 5
5 B 5 6

若想要將表格中的資料依據 x 欄位合併,將相同名稱的列合併為一列,其餘的數值欄位以加總的方式合併,這種狀況就可以使用 dplyr 套件來處理。

首先安裝並載入 dplyr 套件:

# 安裝 dplyr 套件
install.packages("dplyr")

# 載入 dplyr 套件
library(dplyr)

接著將 data frame 以 group_by 分組之後,再以 summarise_all 配合 sum 以加總的方式合併重複的列:

# 分組加總
df %>%
  group_by(x) %>%
  summarise_all(sum)
# A tibble: 2 x 3
  x         y     z
  <fct> <int> <int>
1 A         4     6
2 B        11    14

若要以平均值的方式合併重複的列,可將 sum 函數替換為 mean:

# 分組計算平均
df %>%
  group_by(x) %>%
  summarise_all(mean)
# A tibble: 2 x 3
  x         y     z
  <fct> <dbl> <dbl>
1 A      2     3
2 B      3.67  4.67

若要同時以加總與平均值的方式合併重複列,可以同時將 sum 與 mean 函數傳入 summarise_all 中:

df %>%
  group_by(x) %>%
  summarise_all(list(sum = sum, mean = mean))
# A tibble: 2 x 5
  x     y_sum z_sum y_mean z_mean
        
1 A         4     6   2      3   
2 B        11    14   3.67   4.67

參考資料:Biostars

分類:R

主要資訊欄

搜尋

近期文章

  • Python 使用 PyAutoGUI 自動操作滑鼠與鍵盤
  • Ubuntu Linux 以 WireGuard 架設 VPN 伺服器教學與範例
  • Linux 網路設定 ip 指令用法教學與範例
  • Windows 使用 TPM 虛擬智慧卡保護 SSH 金鑰教學與範例
  • Linux 以 Shamir’s Secret Sharing 分割保存金鑰教學與範例
  • Linux 以 Cryptsetup、LUKS 加密 USB 隨身碟教學與範例
  • Linux 以 Cryptsetup 與 LUKS 加密磁碟教學與範例
  • Linux 使用 age 簡潔的加密、解密工具使用教學與範例

推薦網站

  • Udemy 線上教學課程
  • Coursera 線上教學課程

關注本站

  • 電子郵件
  • Facebook

公益

  • 家扶基金會
  • 台灣世界展望會
  • Yahoo 奇摩公益
  • igiving 公益網
  • 兒福聯盟

Copyright © 2021 · Office Guide