데이터 프레임에서 특정 열 추출
열이 6개인 R 데이터 프레임이 있는데 열이 3개만 있는 새 데이터 프레임을 만들고 싶습니다.
내 데이터 프레임이df
그리고 저는 열을 추출하고 싶습니다.A
,B
,그리고.E
이게 내가 알아낼 수 있는 유일한 명령입니다.
data.frame(df$A,df$B,df$E)
이것을 하는 더 간결한 방법이 있습니까?
열 이름의 벡터를 사용하여 부분 집합을 지정할 수 있습니다.저는 열 이름을 객체 이름(예:)으로 취급하는 것보다 이러한 접근 방식을 선호합니다.subset()
), 특히 함수, 패키지 또는 응용 프로그램에서 프로그래밍할 때.
# data for reproducible example
# (and to avoid confusion from trying to subset `stats::df`)
df <- setNames(data.frame(as.list(1:5)), LETTERS[1:5])
# subset
df[c("A","B","E")]
쉼표가 없습니다(즉, 그렇지 않습니다).df[,c("A","B","C")]
. 그것은.df[,"A"]
데이터 프레임이 아닌 벡터를 반환합니다.그렇지만df["A"]
항상 데이터 프레임을 반환합니다.
str(df["A"])
## 'data.frame': 1 obs. of 1 variable:
## $ A: int 1
str(df[,"A"]) # vector
## int 1
David Dorchies가 그것을 지적해 준 것에 감사합니다.df[,"A"]
data.frame 대신 벡터를 반환하고, 원래 솔루션(아래)에 대한 더 나은 대안(위)을 제안한 Antoine Fabri에게 반환합니다.
# subset (original solution--not recommended)
df[,c("A","B","E")] # returns a data.frame
df[,"A"] # returns a vector
dplyr 패키지 사용(data.frame 호출 시)df1
:
library(dplyr)
df1 %>%
select(A, B, E)
이것은 또한 다음 없이 작성될 수 있습니다.%>%
파이프:
select(df1, A, B, E)
기능의 역할은 다음과 같습니다.
> dat <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9))
> subset(dat, select=c("A", "B"))
A B
1 1 3
2 2 4
두 가지 분명한 선택이 있습니다.조슈아 울리히의df[,c("A","B","E")]
또는
df[,c(1,2,5)]
에 있어서와 같이
> df <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9))
> df
A B C D E F
1 1 3 5 7 8 9
2 2 4 6 7 8 9
> df[,c(1,2,5)]
A B E
1 1 3 8
2 2 4 8
> df[,c("A","B","E")]
A B E
1 1 3 8
2 2 4 8
단지 어떤 이유로
df[, (names(df) %in% c("A","B","E"))]
저를 위해 일했습니다.위의 모든 구문에서 "정의되지 않은 열 선택됨"이 생성되었습니다.
여기서 df1은 원래 데이터 프레임입니다.
df2 <- subset(df1, select = c(1, 2, 5))
사용할 수도 있습니다.sqldf
R 데이터 프레임에서 다음과 같이 선택을 수행하는 패키지:
df1 <- sqldf("select A, B, E from df")
이것은 출력으로 데이터 프레임을 제공합니다.df1
열: A, B, E.
사용할 수 있습니다.with
:
with(df, data.frame(A, B, E))
df<- dplyr::select ( df,A,B,C)
또한 새로 생성된 데이터에 다른 이름을 할당할 수 있습니다.
data<- dplyr::select ( df,A,B,C)
[
및 부분 집합은 대체할 수 없습니다.
[
열을 하나만 선택한 경우 벡터를 반환합니다.
df = data.frame(a="a",b="b")
identical(
df[,c("a")],
subset(df,select="a")
)
identical(
df[,c("a","b")],
subset(df,select=c("a","b"))
)
언급URL : https://stackoverflow.com/questions/10085806/extracting-specific-columns-from-a-data-frame
'programing' 카테고리의 다른 글
지정된 디렉토리가 Ruby에 있는지 확인하는 방법 (0) | 2023.06.16 |
---|---|
VBA 코드를 사용하여 Excel 2003에서 Excel 워크시트를 이미지로 내보내는 방법은 무엇입니까? (0) | 2023.06.16 |
Vuex에서 개체를 올바르게 혼합하고 격리하는 방법 (0) | 2023.06.16 |
IPthon 노트북의 로깅 모듈에서 출력 가져오기 (0) | 2023.06.16 |
애플리케이션을 릴리스하기 전에 NSLog를 비활성화해야 합니까? (0) | 2023.06.16 |