팬더 데이터 프레임 고유

Paendeo Deiteo Peuleim Goyu



데이터 과학에서 가장 많이 사용되는 Python 라이브러리는 Pandas입니다. Python 프로그래머에게 고성능의 사용자 친화적인 데이터 분석 도구를 제공합니다. 기본 기능과 이를 활용하는 방법을 이해하면 Pandas는 데이터를 변경하는 강력한 도구입니다. 'pandas'에서 데이터를 표 형식으로 저장하는 표준 방법은 DataFrames입니다. 'pandas' DataFrame의 열에서 고유한 값을 가져오기 위해 몇 가지 'pandas' 메서드를 사용할 수 있습니다. DataFrame의 열에서 고유한 값을 가져와야 하고 'pandas' DataFrame의 열에서 값의 중복을 원하지 않을 때 'pandas'가 이를 위해 제공하는 방법을 사용할 수 있습니다. DataFrame의 'pandas' 열에서 고유한 값을 얻기 위한 몇 가지 예 및 출력과 함께 이 가이드에서 이러한 방법을 살펴보겠습니다.

'pandas' DataFrame의 열에서 고유한 값을 가져오는 방법

'pandas' DataFrame의 열에서 고유한 값을 가져오는 데 두 가지 방법을 사용할 수 있습니다. 중복 값을 삭제하고 DataFrame의 열에서 고유한 값만 가져옵니다. 'pandas'가 이 작업을 수행하기 위해 제공하는 방법은 다음과 같습니다.







  • unique() 메서드를 사용하여.
  • drop_dupliactes() 메서드를 사용합니다.

이제 'pandas' DataFrame의 열에서 고유한 값을 가져오기 위해 'pandas' 코드에서 두 가지 방법을 모두 사용할 것입니다.



예 # 01

'Spyder' 앱은 'pandas' DataFrame의 열에서 고유한 값을 가져오는 데 도움이 되는 이러한 방법을 활용하기 위해 이러한 'pandas' 코드를 생성하는 데 사용됩니다. DataFrame을 생성하기 전에 'pandas' 코드에 필요한 'pandas' 모듈을 가져와야 합니다. '가져오기'라는 용어를 사용하고 'pandas as pd'를 배치하여 이러한 모듈을 가져옵니다.



이제 'pd'의 도움으로 'pandas' 함수 또는 메서드를 빠르게 얻을 수 있습니다. 그런 다음 'Name'을 추가한 'Subject_data'를 입력하고 'Name'에 'Roman, William, Peter, Smith, John, Milli, Thomas, James'라는 이름의 데이터를 추가합니다. 그런 다음 '수학, 경제, 과학, 수학, 통계, 통계, 통계 및 컴퓨터'인 'Subj'에 주제 데이터를 추가합니다. 그런 다음 'pd.DataFrame()' 메서드를 사용하여 이 'Subject_data'를 'Subject_df' DataFrame으로 변환합니다. 터미널에 표시되도록 'print()' 메서드에 'Subject_df'를 배치합니다.





이제 'pandas' DataFrame의 'Subj' 열에서 고유한 값을 가져오고 싶습니다. 이를 위해 여기에서는 'unique()' 메서드를 사용하고 아래와 같이 열 이름과 DataFrame 이름을 추가합니다. 결과가 터미널에도 표시되도록 'print()'에 이 메서드를 추가합니다.



이제 이 코드의 결과를 얻기 위해 'Shift+Enter'를 누르고 터미널에서 렌더링되며 모든 값이 포함된 DataFrame이 포함된 여기에도 표시됩니다. 이것은 코드에 추가한 원본 DataFrame이며 그 아래에 'Subj' 열의 고유한 값이 표시됩니다. 중복 값을 삭제하고 DataFrame의 'Subj' 열의 고유 값을 표시합니다.

예 # 02

일부 정보가 포함된 'Sample_list'를 만듭니다. 이 목록을 DataFrame으로 변환할 때 첫 번째 열로 나타날 'Layla, 21, 28, 31, 14, 39'를 삽입합니다. 그런 다음 DataFrame의 두 번째 행으로 'Lusy, 31, 25, 34, 26, 21'을 추가합니다. 그 다음에는 DataFrame의 세 번째와 네 번째 행이 될 'Peter, 38, 20, 20, 35, 24'와 'Layla 38, 23, 39 24, 23'이 있습니다. 또한 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' 및 'Peter, 21, 21, 31, 21, 29'의 세 가지 데이터를 추가로 삽입합니다. .

이제 'pd.DataFrame()' 함수를 넣어 'Sample_list'를 DataFrame의 이름인 'DF_Sample'로 변환합니다. 또한 이 DataFrame의 열 이름을 설정하고 이러한 이름은 'Name, Ass_1, Ass_2, Ass_3, Ass_4 및 Ass_5'입니다. 그런 다음 DataFrame 'DF_Sample'을 표시하는 데 도움이 되는 'print()'를 사용합니다. 이제 이 예제에서는 DataFrame의 열에서 고유한 값을 가져오기 위해 다른 방법을 사용하고 있습니다. 이 메서드는 'pandas'의 'drop_duplicates()' 메서드입니다.

'drop_duplicates()' 메서드에서 DataFrame의 열에서 고유한 값을 가져오려는 열의 이름을 설정합니다. 'drop_duplicates()' 메서드를 사용하여 이 열의 중복 값을 삭제하여 'Name' 열의 고유 값을 가져오고 여기에서 'print()' 함수를 사용하여 이러한 고유 값을 렌더링합니다.

'drop_duplicates()' 메서드를 적용한 후 중복된 이름을 삭제하고 고유한 값을 렌더링합니다. '이름' 열의 세 셀에 'Layla' 이름이 나타납니다. 그러나 이 컬럼에 'drop_duplicates()' 메소드를 적용하면 모든 중복 값이 ​​삭제되고 하나의 'Layla' 이름이 화면에 나타납니다. 중복 값을 삭제한 후 이 '이름' 열에 고유한 값이 포함된 새 DataFrame이 나타납니다. 이런 식으로 'drop_duplicates()' 메서드를 사용하여 중복 값을 삭제하고 DataFrame의 열에서 고유한 값을 얻을 수 있습니다.

예 # 03

동일한 DataFrame을 다시 활용하여 여기에서 'unique()' 메소드를 적용하고 있습니다. 'unique()' 메서드를 사용하여 고유 값을 얻기 위해 이 'unique()' 메서드를 적용하려는 DataFrame의 이름과 열 이름을 배치합니다. 이렇게 하면 해당 열의 고유한 값만 렌더링되고 이러한 값은 DataFrame 형식으로 표시되지 않습니다.

여기에서 DataFrame은 'Name' 열에 7개의 값을 포함하지만 이 열에 'unique()' 메서드를 적용하면 4개의 값만 나타나며 이것이 해당 열의 고유한 값입니다. 중복 값을 렌더링하지 않습니다.

예 # 04

이 예제에서 생성한 DataFrame은 'F_G_df'입니다. 이 DataFrame에 'My_fruits' 및 'my_Vegs'를 삽입합니다. 'My_fruits' 열에는 'Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear, and Apple'이 포함됩니다. 다음으로 '칠리, 브링글, 당근, 감자, 감자, 당근, 양파, 마늘, 생강'이라는 야채 이름이 포함된 'My_Vegs'가 있습니다. 이 DataFrame에는 두 개의 열만 있습니다.

이제 'unique()' 메서드를 사용하여 두 열에서 고유한 값을 얻습니다. DataFrame의 이름을 언급합니다. 그런 다음 열 첫 번째 열 이름을 입력합니다. 그런 다음 append() 메서드를 사용합니다. 이 추가에서는 DataFrame의 이름과 두 번째 열 이름을 다시 배치하고 'unique()' 메서드를 배치합니다. 이렇게 하면 두 열의 고유 값을 가져온 다음 두 열의 고유 값을 추가하여 화면에 표시합니다.

DataFrame은 모든 값을 포함하는 먼저 렌더링됩니다. 이후 'unique()' 메소드가 적용되고 두 열의 고유 값이 아래에 렌더링됩니다. 이 코드에서는 'unique()' 메서드를 사용하여 DataFrame의 여러 열에서 고유한 값을 얻습니다.

결론

DataFrame의 열에서 고유한 값을 얻는 방법에 대한 전체 설명은 이 가이드에서 찾을 수 있습니다. DataFrame 열의 고유 값을 가져오는 데 도움이 되는 'unique()' 및 'drop_duplicates()' 메서드에 대해 논의했습니다. 여기 코드에서 이러한 메서드를 사용하여 'pandas' 코드에서 이러한 메서드를 사용하는 방법을 살펴보았습니다. 이 가이드에서 다양한 예를 보여주고 'unique()' 메서드와 'drop_duplicates()' 메서드를 사용하여 한 열의 고유한 값을 가져오는 방법을 보여주었습니다. 또한 이 가이드에서 'unique()' 메서드를 사용하여 여러 열에서 고유한 값을 가져오는 방법을 살펴보았습니다.