데이터 과학에서 가장 많이 사용되는 Python 라이브러리는 Pandas입니다. Python 프로그래머에게 고성능의 사용자 친화적인 데이터 분석 도구를 제공합니다. 기본 기능과 이를 활용하는 방법을 이해하면 Pandas는 데이터를 변경하는 강력한 도구입니다. 'pandas'에서 데이터를 표 형식으로 저장하는 표준 방법은 DataFrames입니다. 'pandas' DataFrame의 열에서 고유한 값을 가져오기 위해 몇 가지 'pandas' 메서드를 사용할 수 있습니다. DataFrame의 열에서 고유한 값을 가져와야 하고 'pandas' DataFrame의 열에서 값의 중복을 원하지 않을 때 'pandas'가 이를 위해 제공하는 방법을 사용할 수 있습니다. DataFrame의 'pandas' 열에서 고유한 값을 얻기 위한 몇 가지 예 및 출력과 함께 이 가이드에서 이러한 방법을 살펴보겠습니다.
'pandas' DataFrame의 열에서 고유한 값을 가져오는 방법
'pandas' DataFrame의 열에서 고유한 값을 가져오는 데 두 가지 방법을 사용할 수 있습니다. 중복 값을 삭제하고 DataFrame의 열에서 고유한 값만 가져옵니다. 'pandas'가 이 작업을 수행하기 위해 제공하는 방법은 다음과 같습니다.
- unique() 메서드를 사용하여.
- drop_dupliactes() 메서드를 사용합니다.
이제 'pandas' DataFrame의 열에서 고유한 값을 가져오기 위해 'pandas' 코드에서 두 가지 방법을 모두 사용할 것입니다.
예 # 01
'Spyder' 앱은 'pandas' DataFrame의 열에서 고유한 값을 가져오는 데 도움이 되는 이러한 방법을 활용하기 위해 이러한 'pandas' 코드를 생성하는 데 사용됩니다. DataFrame을 생성하기 전에 'pandas' 코드에 필요한 'pandas' 모듈을 가져와야 합니다. '가져오기'라는 용어를 사용하고 'pandas as pd'를 배치하여 이러한 모듈을 가져옵니다.
이제 'pd'의 도움으로 'pandas' 함수 또는 메서드를 빠르게 얻을 수 있습니다. 그런 다음 'Name'을 추가한 'Subject_data'를 입력하고 'Name'에 'Roman, William, Peter, Smith, John, Milli, Thomas, James'라는 이름의 데이터를 추가합니다. 그런 다음 '수학, 경제, 과학, 수학, 통계, 통계, 통계 및 컴퓨터'인 'Subj'에 주제 데이터를 추가합니다. 그런 다음 'pd.DataFrame()' 메서드를 사용하여 이 'Subject_data'를 'Subject_df' DataFrame으로 변환합니다. 터미널에 표시되도록 'print()' 메서드에 'Subject_df'를 배치합니다.
이제 'pandas' DataFrame의 'Subj' 열에서 고유한 값을 가져오고 싶습니다. 이를 위해 여기에서는 'unique()' 메서드를 사용하고 아래와 같이 열 이름과 DataFrame 이름을 추가합니다. 결과가 터미널에도 표시되도록 'print()'에 이 메서드를 추가합니다.
이제 이 코드의 결과를 얻기 위해 'Shift+Enter'를 누르고 터미널에서 렌더링되며 모든 값이 포함된 DataFrame이 포함된 여기에도 표시됩니다. 이것은 코드에 추가한 원본 DataFrame이며 그 아래에 'Subj' 열의 고유한 값이 표시됩니다. 중복 값을 삭제하고 DataFrame의 'Subj' 열의 고유 값을 표시합니다.
예 # 02
일부 정보가 포함된 'Sample_list'를 만듭니다. 이 목록을 DataFrame으로 변환할 때 첫 번째 열로 나타날 'Layla, 21, 28, 31, 14, 39'를 삽입합니다. 그런 다음 DataFrame의 두 번째 행으로 'Lusy, 31, 25, 34, 26, 21'을 추가합니다. 그 다음에는 DataFrame의 세 번째와 네 번째 행이 될 'Peter, 38, 20, 20, 35, 24'와 'Layla 38, 23, 39 24, 23'이 있습니다. 또한 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' 및 'Peter, 21, 21, 31, 21, 29'의 세 가지 데이터를 추가로 삽입합니다. .
이제 'pd.DataFrame()' 함수를 넣어 'Sample_list'를 DataFrame의 이름인 'DF_Sample'로 변환합니다. 또한 이 DataFrame의 열 이름을 설정하고 이러한 이름은 'Name, Ass_1, Ass_2, Ass_3, Ass_4 및 Ass_5'입니다. 그런 다음 DataFrame 'DF_Sample'을 표시하는 데 도움이 되는 'print()'를 사용합니다. 이제 이 예제에서는 DataFrame의 열에서 고유한 값을 가져오기 위해 다른 방법을 사용하고 있습니다. 이 메서드는 'pandas'의 'drop_duplicates()' 메서드입니다.
'drop_duplicates()' 메서드에서 DataFrame의 열에서 고유한 값을 가져오려는 열의 이름을 설정합니다. 'drop_duplicates()' 메서드를 사용하여 이 열의 중복 값을 삭제하여 'Name' 열의 고유 값을 가져오고 여기에서 'print()' 함수를 사용하여 이러한 고유 값을 렌더링합니다.
'drop_duplicates()' 메서드를 적용한 후 중복된 이름을 삭제하고 고유한 값을 렌더링합니다. '이름' 열의 세 셀에 'Layla' 이름이 나타납니다. 그러나 이 컬럼에 'drop_duplicates()' 메소드를 적용하면 모든 중복 값이 삭제되고 하나의 'Layla' 이름이 화면에 나타납니다. 중복 값을 삭제한 후 이 '이름' 열에 고유한 값이 포함된 새 DataFrame이 나타납니다. 이런 식으로 'drop_duplicates()' 메서드를 사용하여 중복 값을 삭제하고 DataFrame의 열에서 고유한 값을 얻을 수 있습니다.
예 # 03
동일한 DataFrame을 다시 활용하여 여기에서 'unique()' 메소드를 적용하고 있습니다. 'unique()' 메서드를 사용하여 고유 값을 얻기 위해 이 'unique()' 메서드를 적용하려는 DataFrame의 이름과 열 이름을 배치합니다. 이렇게 하면 해당 열의 고유한 값만 렌더링되고 이러한 값은 DataFrame 형식으로 표시되지 않습니다.
여기에서 DataFrame은 'Name' 열에 7개의 값을 포함하지만 이 열에 'unique()' 메서드를 적용하면 4개의 값만 나타나며 이것이 해당 열의 고유한 값입니다. 중복 값을 렌더링하지 않습니다.
예 # 04
이 예제에서 생성한 DataFrame은 'F_G_df'입니다. 이 DataFrame에 'My_fruits' 및 'my_Vegs'를 삽입합니다. 'My_fruits' 열에는 'Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear, and Apple'이 포함됩니다. 다음으로 '칠리, 브링글, 당근, 감자, 감자, 당근, 양파, 마늘, 생강'이라는 야채 이름이 포함된 'My_Vegs'가 있습니다. 이 DataFrame에는 두 개의 열만 있습니다.
이제 'unique()' 메서드를 사용하여 두 열에서 고유한 값을 얻습니다. DataFrame의 이름을 언급합니다. 그런 다음 열 첫 번째 열 이름을 입력합니다. 그런 다음 append() 메서드를 사용합니다. 이 추가에서는 DataFrame의 이름과 두 번째 열 이름을 다시 배치하고 'unique()' 메서드를 배치합니다. 이렇게 하면 두 열의 고유 값을 가져온 다음 두 열의 고유 값을 추가하여 화면에 표시합니다.
DataFrame은 모든 값을 포함하는 먼저 렌더링됩니다. 이후 'unique()' 메소드가 적용되고 두 열의 고유 값이 아래에 렌더링됩니다. 이 코드에서는 'unique()' 메서드를 사용하여 DataFrame의 여러 열에서 고유한 값을 얻습니다.
결론
DataFrame의 열에서 고유한 값을 얻는 방법에 대한 전체 설명은 이 가이드에서 찾을 수 있습니다. DataFrame 열의 고유 값을 가져오는 데 도움이 되는 'unique()' 및 'drop_duplicates()' 메서드에 대해 논의했습니다. 여기 코드에서 이러한 메서드를 사용하여 'pandas' 코드에서 이러한 메서드를 사용하는 방법을 살펴보았습니다. 이 가이드에서 다양한 예를 보여주고 'unique()' 메서드와 'drop_duplicates()' 메서드를 사용하여 한 열의 고유한 값을 가져오는 방법을 보여주었습니다. 또한 이 가이드에서 'unique()' 메서드를 사용하여 여러 열에서 고유한 값을 가져오는 방법을 살펴보았습니다.