팬더는 난을 0으로 채웁니다.

Paendeoneun Nan Eul 0eulo Chaeubnida



데이터 과학에는 일반적으로 누락된 데이터가 포함됩니다. 전체 행을 버리거나 행-열 조합에 값을 추가할 수 있습니다. 행/열을 삭제하는 것은 모든 행에 대해 특정 메트릭을 제거하기 때문에 터무니없을 것입니다. 'Not a Number'를 의미하는 NaN은 데이터 집합에서 누락된 값을 표시하는 일반적인 방법 중 하나입니다. 의도한 결과를 얻으려면 NaN을 처리하는 것이 매우 중요합니다. 그럼 Pandas DataFrame의 행 또는 열에 있는 NaN 값을 0으로 변경하는 방법을 알아보겠습니다.

팬더는 NaN 값을 채웁니다.

데이터 프레임의 열에 NaN 또는 None 값이 있는 경우 'fillna()' 또는 'replace()' 함수를 사용하여 0으로 채울 수 있습니다.

채우다()







NA/NaN 값은 'fillna()' 함수를 사용하여 제공된 접근 방식으로 채워집니다. 다음 구문을 고려하여 활용할 수 있습니다.



단일 열에 대해 NaN 값을 채우려는 경우 구문은 다음과 같습니다.




전체 DataFrame에 대해 NaN 값을 채워야 하는 경우 구문은 다음과 같습니다.






바꾸다()

NaN 값의 단일 열을 대체하기 위해 제공된 구문은 다음과 같습니다.




반면, 전체 DataFrame의 NaN 값을 바꾸려면 다음과 같은 구문을 사용해야 합니다.


이 글에서 우리는 이제 Pandas DataFrame에서 NaN 값을 채우기 위해 이 두 가지 방법의 실제 구현을 탐구하고 배울 것입니다.

예제 1: Pandas 'Fillna()' 메서드를 사용하여 NaN 값 채우기

이 그림은 주어진 DataFrame의 NaN 값을 0으로 채우는 Pandas 'DataFrame.fillna()' 함수의 적용을 보여줍니다. 단일 열에 누락된 값을 채우거나 전체 DataFrame에 대해 이를 채울 수 있습니다. 여기에서 우리는 이 두 가지 기술을 모두 볼 것입니다.

이러한 전략을 실행하려면 프로그램 실행을 위한 적절한 플랫폼을 확보해야 합니다. 그래서 우리는 'Spyder' 도구를 사용하기로 결정했습니다. Pandas 기능을 사용하여 DataFrame을 구성하고 해당 DataFrame의 누락된 값을 채워야 하기 때문에 'pandas' 툴킷을 프로그램으로 가져와 Python 코드를 시작했습니다. 'pd'는 프로그램 전체에서 'pandas'의 별칭으로 사용됩니다.

이제 Pandas 기능에 액세스할 수 있습니다. 먼저 'pd.DataFrame()' 함수를 사용하여 DataFrame을 생성합니다. 이 메서드를 호출하고 3개의 열로 초기화했습니다. 이 열의 제목은 'M1', 'M2' 및 'M3'입니다. 'M1' 열의 값은 '1', '없음', '5', '9' 및 '3'입니다. 'M2'의 항목은 '없음', '3', '8', '4' 및 '6'입니다. 'M3'는 데이터를 '1', '2', '3', '5' 및 'None'으로 저장합니다. 'pd.DataFrame()' 메서드가 호출될 때 이 DataFrame을 저장할 수 있는 DataFrame 개체가 필요합니다. '누락된' DataFrame 개체를 만들고 'pd.DataFrame()' 함수에서 얻은 결과로 할당했습니다. 그런 다음 Python의 'print()' 메서드를 사용하여 Python 콘솔에 DataFrame을 표시했습니다.


이 코드 덩어리를 실행하면 터미널에서 3개의 열이 있는 DataFrame을 볼 수 있습니다. 여기에서 세 열 모두에 null 값이 포함되어 있음을 관찰할 수 있습니다.


누락된 값을 0으로 채우기 위해 Pandas 'fillna()' 함수를 적용하기 위해 일부 null 값이 있는 DataFrame을 만들었습니다. 이를 수행하는 방법을 알아보겠습니다.

DataFrame을 표시한 후 Pandas 'fillna()' 함수를 호출했습니다. 여기서는 하나의 열에 누락된 값을 채우는 방법을 배웁니다. 이에 대한 구문은 이미 자습서 시작 부분에 언급되어 있습니다. DataFrame의 이름을 제공하고 '.fillna()' 함수로 특정 열 제목을 지정했습니다. 이 메서드의 괄호 사이에는 null 자리에 들어갈 값을 제공했습니다. DataFrame 이름은 'missing'이고 여기에서 선택한 열은 'M2'입니다. 'fillna()'의 중괄호 사이에 제공된 값은 '0'입니다. 마지막으로 업데이트된 DataFrame을 보기 위해 'print()' 함수를 호출했습니다.


여기서 DataFrame의 'M2' 열에는 이제 NaN 값이 0으로 채워지기 때문에 누락된 값이 없는 것을 볼 수 있습니다.


전체 DataFrame에 대한 NaN 값을 동일한 방법으로 채우기 위해 'fillna()'를 호출했습니다. 이것은 아주 간단합니다. 'fillna()' 함수로 DataFrame 이름을 제공하고 괄호 사이에 함수 값 '0'을 할당했습니다. 마지막으로 'print()' 함수는 채워진 DataFrame을 보여줍니다.


이제 모든 값이 0으로 다시 채워지기 때문에 NaN 값이 없는 DataFrame을 얻습니다.

예 2: Pandas 'Replace()' 메서드를 사용하여 NaN 값 채우기

이 기사에서는 DataFrame에서 NaN 값을 채우는 또 다른 방법을 보여줍니다. Pandas의 'replace()' 함수를 사용하여 단일 열과 완전한 DataFrame의 값을 채웁니다.

'Spyder' 도구에서 코드 작성을 시작합니다. 먼저 필요한 라이브러리를 가져왔습니다. 여기에서 Python 프로그램이 Pandas 메서드를 사용할 수 있도록 Pandas 라이브러리를 로드했습니다. 로드한 두 번째 라이브러리는 NumPy이며 'np'로 별칭을 지정합니다. NumPy는 'replace()' 메소드를 사용하여 누락된 데이터를 처리합니다.

그런 다음 '나사', '못' 및 '드릴'의 세 가지 열이 있는 DataFrame을 생성했습니다. 각 열의 값은 각각 제공됩니다. '나사' 열에는 '112', '234', '없음' 및 '650' 값이 있습니다. '네일' 열에는 '123', '145', '없음' 및 '711'이 있습니다. 마지막으로 '드릴' 열에는 '312', '없음', '500' 및 '없음' 값이 있습니다. DataFrame은 'tool' DataFrame 객체에 저장되고 'print()' 메서드를 사용하여 표시됩니다.


레코드에 4개의 NaN 값이 있는 DataFrame은 다음 출력 이미지에서 볼 수 있습니다.


이제 Pandas 'replace()' 메서드를 사용하여 DataFrame의 단일 열에 null 값을 채웁니다. 작업을 위해 'replace()' 함수를 호출했습니다. DataFrame 이름 'tool'과 'screw' 열을 '.replace()' 메서드로 제공했습니다. 중괄호 사이에 DataFrame의 'np.nan' 항목에 대해 값 '0'을 설정합니다. 'print()' 메서드는 출력을 표시하는 데 사용됩니다.


결과 DataFrame은 '나사' 열에서 NaN 항목이 0으로 대체되는 첫 번째 열을 보여줍니다.


이제 전체 DataFrame의 값을 채우는 방법을 배웁니다. DataFrame의 이름으로 'replace()' 메서드를 호출하고 np.nan 항목으로 대체하려는 값을 제공했습니다. 마지막으로 'print()' 함수로 업데이트된 DataFrame을 인쇄했습니다.


이렇게 하면 누락된 레코드가 없는 결과 DataFrame이 생성됩니다.

결론

DataFrame에서 누락된 항목을 처리하는 것은 기본이며 데이터 분석 프로세스에서 복잡성을 줄이고 데이터를 도전적으로 처리하는 데 필요한 요구 사항입니다. Pandas는 이 문제에 대처할 수 있는 몇 가지 옵션을 제공합니다. 우리는 이 가이드에서 두 가지 편리한 전략을 가져왔습니다. 우리는 'Spyder' 도구의 도움으로 두 기술을 모두 실행하여 샘플 코드를 실행하여 작업을 좀 더 이해하기 쉽고 쉽게 만듭니다. 이러한 기능에 대한 지식을 얻으면 Pandas 기술이 향상됩니다.