R DataFrame에서 여러 열 가져오기

R Dataframeeseo Yeoleo Yeol Gajyeoogi



R에서 열 수를 가져오는 것은 DataFrame으로 작업할 때 많은 상황에서 필요한 기본 작업입니다. 데이터를 부분 집합화, 분석, 조작, 게시 및 시각화할 때 열 수는 알아야 할 중요한 정보입니다. 따라서 R은 지정된 DataFrame의 열 총계를 얻기 위해 다양한 접근 방식을 제공합니다. 이 기사에서는 DataFrame의 열 수를 얻는 데 도움이 되는 몇 가지 접근 방식에 대해 설명합니다.

예제 1: Ncol() 함수 사용

ncol()은 DataFrames의 총 열을 가져오는 가장 빈번한 함수입니다.







df <- 데이터.프레임('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----데이터 프레임의 열 수:', n)

이 예제에서는 먼저 R의 data.frame() 함수를 사용하여 'y1', 'y2' 및 'y3'으로 레이블이 지정된 세 개의 열이 있는 'df' DataFrame을 만듭니다. 각 열의 요소는 다음을 사용하여 지정됩니다. 요소의 벡터를 생성하는 c() 함수. 그런 다음 'n' 변수를 사용하여 ncol() 함수를 사용하여 'df' DataFrame의 총 열을 결정합니다. 마지막으로 설명 메시지와 'n' 변수를 사용하여 제공된 cat() 함수가 결과를 콘솔에 출력합니다.



예상대로 검색된 출력은 지정된 DataFrame에 세 개의 열이 있음을 나타냅니다.







예 2: 빈 DataFrame의 총 열 수 계산

다음으로 ncol() 함수를 빈 DataFrame에 적용합니다. 이 함수는 전체 열의 값도 가져오지만 해당 값은 0입니다.

empty_df <- 데이터.프레임()

n <- ncol(빈_df)

cat('---데이터 프레임의 열:', n)

이 예제에서는 열이나 행을 지정하지 않고 data.frame()을 호출하여 빈 DataFrame 'empty_df'를 생성합니다. 다음으로 DataFrame에서 열 수를 찾는 데 사용되는 ncol() 함수를 사용합니다. ncol() 함수는 여기에서 'empty_df' DataFrame으로 설정되어 전체 열을 가져옵니다. 'empty_df' DataFrame은 비어 있으므로 열이 없습니다. 따라서 ncol(empty_df)의 출력은 0입니다. 결과는 여기에 배포된 cat() 함수에 의해 표시됩니다.



DataFrame이 비어 있기 때문에 출력에 예상대로 값 '0'이 표시됩니다.

예 3: Select_If() 함수를 Length() 함수와 함께 사용

특정 유형의 열 수를 검색하려면 R의 length() 함수와 함께 select_if() 함수를 사용해야 합니다. 이러한 함수는 각 유형의 총 열을 얻기 위해 결합되어 사용됩니다. . 이러한 기능을 사용하는 코드는 다음과 같이 구현됩니다.

라이브러리(dplyr)

x1<-LETTERS[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('여름','겨울'),10,replace=TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

길이(select_if(df1,is.numeric))

이 예제에서는 먼저 dplyr 패키지를 로드하여 select_if() 함수와 length() 함수에 액세스할 수 있습니다. 그런 다음 각각 'x1', 'x2', 'x3' 및 'x4'의 네 가지 변수를 만듭니다. 여기서 'x1'은 영어 알파벳의 첫 10개 대문자를 포함합니다. 'x2' 및 'x3' 변수는 rpois() 함수를 사용하여 생성되어 각각 매개변수 2 및 5를 갖는 10개의 난수로 구성된 두 개의 개별 벡터를 생성합니다. 'x4' 변수는 벡터 c('Summer', 'Winter')에서 임의로 샘플링된 10개의 요소가 있는 요인 벡터입니다.

그런 다음 모든 변수가 data.frame() 함수에 전달되는 'df1' DataFrame을 생성하려고 시도합니다. 마지막으로 length() 함수를 호출하여 dplyr 패키지의 select_if() 함수를 사용하여 생성된 'df1' DataFrame의 길이를 결정합니다. select_if() 함수는 'df1' DataFrame에서 열을 인수로 선택하고 is.numeric() 함수는 숫자 값을 포함하는 열만 선택합니다. 그런 다음 length() 함수는 전체 코드의 출력인 select_if()에 의해 선택된 열의 합계를 가져옵니다.

열의 길이는 DataFrame의 총 열을 나타내는 다음 출력에 표시됩니다.

예제 4: Sapply() 함수 사용

반대로 열의 누락된 값만 계산하려는 경우에는 sapply() 함수가 있습니다. sapply() 함수는 DataFrame의 각 열을 반복하여 구체적으로 작동합니다. sapply() 함수는 먼저 DataFrame을 인수로 전달합니다. 그런 다음 해당 DataFrame에서 수행할 작업을 수행합니다. DataFrame 열에서 NA 값의 수를 가져오는 sapply() 함수의 구현은 다음과 같이 제공됩니다.

new_df <- 데이터.프레임(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

이 예에서는 'c1', 'c2' 및 'c3'의 3개 열이 있는 'new_df' DataFrame을 생성합니다. 첫 번째 열 'c1' 및 'c3'에는 NA로 표시되는 일부 누락된 값을 포함하는 숫자 값이 포함됩니다. 두 번째 열 'c2'에는 NA로 표시되는 일부 누락된 값을 포함하는 문자가 포함됩니다. 그런 다음 sapply() 함수를 'new_df' DataFrame에 적용하고 sapply() 함수 내부의 sum() 표현식을 사용하여 각 열에서 누락된 값의 수를 계산합니다.

is.na() 함수는 열의 각 요소가 누락되었는지 여부를 나타내는 논리 벡터를 반환하는 sum() 함수에 지정된 표현식입니다. sum() 함수는 TRUE 값을 더하여 각 열에서 누락된 값의 수를 계산합니다.

따라서 출력에는 각 열의 총 NA 값이 표시됩니다.

예제 5: Dim() 함수 사용

또한 DataFrame의 행과 함께 전체 열을 가져오려고 합니다. 그런 다음 dim() 함수는 DataFrame의 크기를 제공합니다. dim() 함수는 차원을 검색하려는 인수로 개체를 사용합니다. 다음은 dim() 함수를 사용하는 코드입니다.

d1 <- 데이터.프레임(팀=c('t1', 't2', 't3', 't4'),

포인트=c(8, 10, 7, 4))

희미한(d1)

이 예제에서는 먼저 두 개의 열이 'team' 및 'points'로 설정된 data.frame() 함수를 사용하여 생성된 'd1' DataFrame을 정의합니다. 그런 다음 'd1' DataFrame에 대해 dim() 함수를 호출합니다. dim() 함수는 DataFrame의 행과 열의 수를 반환합니다. 따라서 dim(d1)을 실행할 때 두 요소가 있는 벡터를 반환합니다. 첫 번째 요소는 'd1' DataFrame의 행 수를 반영하고 두 번째 요소는 열 수를 나타냅니다.

출력은 값 '4'가 전체 열을 나타내고 값 '2'가 행을 나타내는 DataFrame의 크기를 나타냅니다.

결론

우리는 이제 R에서 열 수를 세는 것이 DataFrame에서 수행할 수 있는 간단하고 중요한 작업이라는 것을 배웠습니다. 모든 함수 중에서 ncol() 함수가 가장 편리한 방법입니다. 이제 주어진 DataFrame에서 열 수를 가져오는 다양한 방법에 대해 잘 알고 있습니다.