팬더 시리즈를 CSV로

Paendeo Silijeuleul Csvlo



Pandas의 'Series.to_csv()' 메소드는 지정된 시리즈 객체를 쉼표로 구분된 값(csv) 표기법으로 출력합니다. 이 함수는 단순히 계열에서 값을 가져오고 인덱스와 열 값을 구분하기 위해 쉼표를 추가하여 형식을 수정합니다.

이 기능을 사용하려면 다음 구문을 사용해야 합니다.









이 기사에서는 파이썬 프로그램에서 이 방법을 사용하는 방법을 배우기 위한 두 가지 다른 기술을 제공합니다.



예제 # 1: Series.to_csv() 메서드를 사용하여 DatetimeIndex가 있는 시리즈를 쉼표로 구분된 값으로 변환

시리즈를 CSV 형식으로 수정하기 위해 'Series.to_csv()' 함수를 사용합니다. 이 그림은 DatetimeIndex가 있는 시리즈를 생성한 다음 쉼표로 구분된 값 형식으로 변환합니다.





이 방법을 실행하려면 파이썬 프로그래밍을 지원하는 도구가 있어야 합니다. 'Spyder' 도구는 코드 컴파일을 위해 선택됩니다. 스크립트를 작성하기 위해 먼저 시스템에 설치된 도구를 시작했습니다. 파이썬 프로그램은 필요한 결과를 얻기 위한 방법을 실행하기 위해 라이브러리가 필요합니다. 여기에 로드한 라이브러리는 'Pandas'입니다. 같은 코드 줄에서 이 라이브러리의 별칭은 'pd'로 식별됩니다. 따라서 프로그램의 어느 위치에서든 함수에 액세스하려면 'pandas'를 작성해야 합니다. 대신 'pd'를 씁니다.

코드로 시작하는 첫 번째 단계는 Pandas 시리즈를 생성하는 것입니다. pandas의 시리즈 생성 방법을 사용하려면 'pd'를 작성해야 합니다. 'pd.Series()' 함수는 지정된 값으로 시리즈를 구성하기 위해 호출됩니다. 시리즈에 제공한 값은 'Istanbul', 'Izmir', 'Ankara', 'Ankara', 'Antalya', 'Konya' 및 'Bursa'입니다. 이 값 배열에 이름을 지정하려면 'name' 매개변수를 사용하면 됩니다. 여기서는 6개 도시의 이름을 보유하고 있으므로 이 값 배열을 'Cities'라고 명명했습니다. 이 시리즈를 저장하기 위해 시리즈 개체 'Turkey'가 생성되었습니다.



DatetimeIndex를 생성하기 위해 'pd.date_range()' 메서드를 호출했습니다. 이 함수의 괄호 사이에 'start', 'freq', 'periods' 및 'tz'인 4개의 인수를 전달했습니다.

'start' 인수는 날짜와 시간을 받아 날짜 범위 생성을 시작합니다. 여기서는 시작 날짜와 시간을 '2022-03-02 02:30'으로 지정했습니다. 'freq' 매개변수는 날짜 범위의 빈도를 분류합니다. 그래서 우리는 값 'D'를 제공했습니다. 이제 일일 빈도에 대한 날짜 범위를 생성합니다. 'period' 인수는 '6'으로 설정되며 이는 6일 동안의 날짜 범위를 생성함을 의미합니다. 마지막 매개변수는 지정된 영역의 시간대를 지정하는 'tz'입니다. '아시아/이스탄불'의 시간대를 지정했습니다.

이 날짜 범위를 저장하기 위해 'Datetime' 변수를 만들었습니다. DatetimeIndex를 설정하기 위해 'Series.index' 속성을 사용했습니다. 'Turkey' 시리즈의 이름은 '.index' 속성과 함께 제공되고 'Datetime' 변수에 저장된 날짜 시간 범위에 할당됩니다. 따라서 'index' 속성은 'Datetime' 변수에서 값을 가져와 'Turkey' 시리즈의 인덱스 목록으로 만듭니다. 마지막으로 출력 시리즈를 보기 위해 'print()' 메서드를 사용하고 'Turkey' 시리즈를 입력으로 전달하여 내용을 표시했습니다.

스크립트를 실행하기 위해 '파일 실행' 옵션을 눌렀습니다. 결과적으로 '2022-03-02 02:30:00+03:00'에서 시작하여 '2022-03-07 02:30:00+03:00'으로 끝나는 DatetimeIndex가 있는 시리즈를 볼 수 있습니다. 6일 중. “Freq :D” 시리즈 아래에는 배열 목록 “Cities”의 이름과 dtype “object”도 언급되어 있습니다.

이제 위의 스냅샷에서 본 이 시리즈를 CSV 형식으로 변환하는 방법을 배웁니다. 시리즈를 쉼표로 구분된 값으로 수정하기 위해 'Series.to_csv()'라는 pandas 모듈에서 제공하는 메서드가 있습니다. 이 메서드는 제공된 계열의 값을 가져오고 열 값 사이에 쉼표를 추가합니다.

'Series.to_csv()' 함수가 호출됩니다. 변환하고자 하는 시리즈의 이름은 'Turkey.to_csv()'라는 메소드와 함께 언급됩니다. 쉼표로 구분된 값을 유지하기 위해 'Comma_Separated' 변수를 만든 다음 'print()' 함수를 호출하여 해당 내용을 출력 창에 넣습니다.

다음은 csv 형식의 시리즈입니다. 스냅샷에서 인덱스와 시리즈 값이 쉼표를 사용하여 구분되었음을 알 수 있습니다.

예제 # 2: Series.to_csv() 메서드를 사용하여 NaN 값이 있는 계열을 쉼표로 구분된 값으로 변환

'Series.to_csv()' 메소드를 실행하는 두 번째 기술은 이 메소드를 적용하여 일부 null 항목이 포함된 시리즈를 CSV 형식으로 변환하는 것입니다.

처음에 필요한 패키지를 가져왔습니다. 'pd'는 pandas의 별칭이 되고 'np'는 numpy의 별칭이 됩니다. pandas 'pd.Series()' 메서드를 사용하여 생성하는 동안 'np.NaN'을 사용하여 시리즈에 일부 null 항목을 만들기 때문에 numpy 툴킷이 여기에 로드됩니다.

'pd.Series()' 함수는 'Nile', 'Amazon', np.NaN, 'Ganges', 'Mississippi', 'np.NaN', 'Yangtze', '다뉴브', '메콩', 'np.NaN' 및 '볼가'. 시리즈에 대해 정의된 총 21개의 값이 있으며 그 중 3개의 항목이 'np.NaN' 값을 보유하고 있으며 이는 3개의 값이 시리즈에서 누락되었음을 의미합니다. '이름' 속성은 '제목'을 제공한 이 값 배열의 이름을 지정합니다. 'index' 속성은 기본 목록을 사용하는 대신 사용자 정의 인덱스 목록을 설정하는 데 활용됩니다.

여기에서 값이 '10', '11', '12', '13', '14', '16', '17', '18', '19', '20'인 인덱스 목록이 필요합니다. 그리고 21'. 이제 우리 시리즈에는 '0' 대신 '10'부터 시작하는 색인 ​​목록이 있습니다. 이제 이 시리즈를 저장하여 나중에 프로그램에서 사용할 수 있습니다. 시리즈 객체 'Rivers'를 초기화하고 'pd.Series()' 메서드를 호출하여 생성된 출력 시리즈를 할당합니다. 시리즈는 파이썬의 'print()' 함수를 사용하여 디스플레이에 표시하면 볼 수 있습니다.

터미널에서 렌더링된 출력은 인덱스 목록이 10에서 시작하고 21에서 끝나는 시리즈를 인쇄했는데 이는 시리즈에 21개의 값이 있음을 의미합니다.

시리즈는 'Series.to_csv()' 메소드를 사용하여 CSV 형식으로 변환됩니다.

'Turkey' 시리즈와 함께 'Series.to_csv()' 메서드를 호출했습니다. 따라서 이 방법은 '터키' 시리즈의 값을 쉼표로 구분된 값 형식으로 변환합니다. 결과는 'Converted_csv' 변수에 저장됩니다. 그리고 궁극적으로 변환된 시리즈는 'print()' 함수의 도움으로 인쇄됩니다.

아래 결과의 스냅샷에서 시리즈 값이 인덱스 목록에서 쉼표를 사용하여 구분하는 방식으로 변경되었음을 알 수 있습니다. 또한 값이 누락된 경우 인덱스 번호만 쉼표로 인쇄됩니다.

결론

pandas 시리즈를 CSV 형식으로 수정하는 것은 실용적인 접근 방식입니다. 이것은 pandas 'Series.to_csv()' 함수를 사용하여 달성할 수 있습니다. 이 가이드에서는 이 방법을 사용하기 위해 두 가지 기술을 사용했습니다. 첫 번째 그림에서는 이 메서드를 호출하여 DatetimeIndex가 있는 계열을 쉼표로 구분된 값 형식으로 변환했습니다. 두 번째 인스턴스는 'Series.to_csv()' 함수를 사용하여 일부 누락된 항목이 있는 시리즈를 CSV 형식으로 수정했습니다. 두 기술 모두 Windows 운영 체제에서 'Spyder' 도구를 사용하여 실제로 구현되었습니다.