파이썬에서 XLSX를 CSV로

Paisseon Eseo Xlsxleul Csvlo



최근 몇 년 동안 Python은 지배적인 프로그래밍 언어 중 하나로 부상했습니다. Python 커뮤니티는 Python의 인기와 유용성의 결과로 크게 확장되었습니다. 이 기사에서는 Python을 사용하여 XLSX를 CSV로 변환하는 방법에 대해 자세히 설명합니다. Excel 파일은 재무 분석, 데이터 구성, 데이터 입력, 회계, 데이터 관리, 차트 및 그래프 생성 등에 자주 사용된다는 것을 알고 있습니다. 그러나 대부분 데이터 가져오기 및 내보내기에는 CSV 파일을 사용하는 것을 선호합니다. 한 가지 접근 방식은 일반 텍스트 파일을 사용하여 구조화된 데이터를 전송하는 것입니다.

Xslx 파일이란?

최신 버전의 Excel에서 스프레드시트를 만들 때 Microsoft는 XLSX 파일을 기본 파일 형식으로 사용합니다. Word의 DOCX 파일 형식과 마찬가지로 다양한 응용 프로그램/프로그램을 사용하여 XLSX 파일을 열 수 있습니다.

CSV 파일이란?

CSV 파일 형식은 테이블 형식 데이터 값을 스프레드시트 및 데이터베이스에 저장하는 데 사용할 수 있습니다. 테이블 형식 데이터(텍스트 또는 텍스트)는 CSV 파일에 일반 텍스트로 저장됩니다. CSV 파일의 레코드는 파일의 각 행에 저장된 데이터 값입니다. 각 레코드에는 쉼표로 구분된 둘 이상의 필드가 있을 수 있습니다.







XLSX와 CSV 파일의 주요 차이점

사용자는 CSV와 XLSX를 번갈아 사용하는 경우가 많으며 일반적으로 이들 간의 차이점, 기본 특성 및 작동 방식을 인식하지 못합니다. 사용자에 대한 정보 소스 역할만 합니다. 거의 모든 비즈니스 및 회사에서 사용자가 사용자를 위해 데이터를 관리, 업데이트 및 저장하는 데 도움을 주기 위해 둘 다 사용합니다. 다음은 알아야 할 XLSX 파일과 CSV 파일의 몇 가지 주요 차이점입니다.



  • CSV 형식은 테이블 형식 데이터를 확장자가 .csv인 구분 기호 텍스트 파일에 저장합니다. 반면 Excel 또는 XLSX 파일은 독점 형식 즉, 파일을 저장하는 스프레드시트입니다. xls 또는 XLSX.
  • Excel 파일은 통합 문서의 모든 워크시트에 있는 데이터를 포함하는 이진 파일입니다. 반면 CSV는 쉼표로 구분된 일련의 데이터 값이 있는 단순하고 단순한 텍스트 형식입니다.
  • CSV 파일에서는 데이터 작업을 수행할 수 없습니다. 그러나 Excel 파일에서 수행할 수 있습니다.
  • CSV 파일은 XLSX 파일보다 빠르고 적은 메모리를 사용합니다. 그러나 Excel은 데이터를 가져올 때 더 많은 메모리를 사용합니다.
  • CSV와 Excel을 비교하면 CSV 파일은 모든 Windows 텍스트 편집기에서 열 수 있지만 Excel 파일은 열 수 없습니다.

Python을 사용하여 XLSX 파일을 CSV로 어떻게 변환할 수 있습니까?

XLSX 파일은 다양한 방법을 사용하여 Python에서 CSV 파일로 변환할 수 있습니다. Python에는 이 작업을 수행하는 데 도움이 되는 다양한 모듈과 함수가 포함되어 있습니다. 여기서는 Python에서 XLSX 파일을 CSV 파일로 변환하는 데 사용할 수 있는 몇 가지 방법을 살펴보겠습니다.



Excel에서 CSV로 변환을 수행하기 위한 전제 조건

요구 사항을 설치하는 것이 첫 번째 단계입니다. 이 튜토리얼에서는 Pandas, CSV 및 Openpyxl 등을 결합하는 것과 같은 모듈을 사용합니다. Python의 Pandas 패키지를 사용하면 데이터를 조작하고 분석할 수 있습니다. Pandas는 Python 프로그래머들 사이에서 잘 알려진 라이브러리입니다. Excel 파일은 Openpyxl로 알려진 Python 패키지를 사용하여 읽고 쓸 수 있습니다. 우리는 이 라이브러리를 직접 다루지 않을 것입니다. Pandas는 대신 내부적으로 Openpyxl을 사용합니다.





PyPI 리포지토리를 사용하여 두 패키지를 모두 설치할 수 있습니다.

방법 1: Pandas 모듈을 사용하여 XLSX를 CSV로 변환

예 1: 하나의 XLSX 파일을 CSV로 변환



Pandas는 데이터를 조작하고 분석하기 위해 Python 프로그래밍 언어용으로 만든 오픈 소스 모듈입니다. 시계열 및 숫자 테이블 작업을 위해 Pandas는 다양한 기능을 제공합니다. Pandas를 사용하면 크고 작은 데이터 세트를 모두 읽고, 필터링하고, 재정렬할 수 있습니다. 그리고 결과는 Excel, JSON, CSV 등 다양한 형식으로 생성할 수 있습니다. Pandas의 read_excel() 메서드를 사용하여 Excel 파일을 읽고 to_csv() 메서드를 사용하여 DataFrame을 CSV 파일로 변환합니다.

출력에서 볼 수 있듯이 .csv 파일을 DataFrame으로 인쇄합니다. 이전 스크립트는 XLSX 파일을 CSV로 변환하고 현재 디렉터리에 'salary.csv' 파일을 생성합니다.

예 2: XLSX 파일(여러 시트 포함)을 CSV로 변환

다음 예제에서는 먼저 Excel 파일의 시트 이름을 읽습니다. 그런 다음 개별 시트의 이름이 반복되어 별개의 CSV 파일로 저장됩니다. 스크립트는 동일한 위치에 CSV를 저장합니다.

두 개 이상의 워크시트 또는 스프레드시트가 있는 샘플 XLSX 파일을 사용합니다.

보시다시피 XLSX 파일은 두 개의 시트(sheet1 및 sheet2)로 구성됩니다. 이제 이 XLSX 파일을 CSV로 변환하는 코드를 작성합니다.

산출:

스크립트는 두 개의 시트가 있는 XLSX 파일을 단일 시트가 있는 단일 CSV 파일로 성공적으로 변환했습니다.

예 3: 여러 XLSX 파일을 별도의 CSV 파일로 변환

작업 디렉토리에 있는 여러 Excel 파일을 CSV로 변환해야 하는 시나리오를 고려하십시오. 이 방법을 사용할 수 있습니다. 각 파일에 하나의 시트만 포함되어 있다고 가정하여 시작합니다. 그런 다음 여러 파일과 여러 시트를 처리하도록 방법을 확장합니다. 다음 Python 코드는 glob 표준 모듈을 사용합니다. Glob의 패턴을 사용하여 파일 경로를 일치시킵니다. 작업 디렉토리에서 확장자가 .xlsx인 모든 파일과 일치합니다. 이후 엑셀 파일을 읽어 CSV 파일로 저장하는 기능을 개발한다. 발견된 각 파일 경로에서 이 함수를 호출합니다.

이 이전 스크립트는 현재 디렉터리의 모든 xlsx 파일을 CSV 파일로 변환합니다.

이제 여러 스프레드시트가 있는 XLSX 파일을 CSV로 변환합니다. 이것은 아마도 가장 어려운 부분입니다. 세 개의 Excel 파일이 작업 디렉토리에 있습니다. 또한 그들 중 일부는 하나 이상의 시트로 구성됩니다. 우리는 다음을 목표로 합니다.

  1. 각 스프레드시트 파일에 대한 디렉토리를 생성합니다.
  2. Excel 파일 시트를 CSV로 변환하고 새로 생성된 디렉토리에 보관해야 합니다.

이 스크립트는 단일 및 다중 시트가 포함된 XLSX를 별도의 CSV 파일로 변환하고 동일한 이름의 새 디렉터리에 저장합니다.

현재 디렉터리에 있는 모든 Excel 파일을 검색하려면 glob 함수를 사용합니다. 그런 다음 os.mkdir 함수를 사용하여 각 XLSX 파일에 대한 폴더가 생성됩니다. 그런 다음 시트 이름을 반복하여 새 디렉토리 내의 각 시트에 대해 CSV 파일이 생성됩니다.

방법 2: Openpyxl 및 CSV 모듈을 사용하여 XLSX를 CSV로 변환

이 방법에서는 openpyxl 및 CSV 모듈을 사용하여 XLSX 파일을 CSV로 변환합니다. 2010 xlsx, xlsm, xltx 및 xltm 파일을 읽고 쓰려면 Python 모듈 openpyxl을 사용할 수 있습니다. CSV 모듈에는 CSV 형식의 테이블 형식 데이터를 읽고 쓸 수 있는 클래스가 포함되어 있습니다.

xlsx 파일을 읽거나 로드하려면 openpyxl 모듈의 load_workbook() 함수를 사용합니다. Python에서 기존 XLSX/Excel 파일을 쓰거나 읽어야 하는 경우 이 기능을 사용할 수 있습니다. Excel을 활성화한 후 csv.writer() 함수를 사용하여 CSV 파일을 만듭니다. 그런 다음 for 루프를 사용하여 CSV 파일의 데이터 셀에 데이터를 저장합니다. 다음 이미지와 같이 example.xlsx 파일을 myfile.csv로 변환합니다.

결론

이 자습서에서는 XLSX 파일 및 CSV 파일에 대한 간략한 소개를 제공했습니다. 두 파일 형식의 주요 차이점을 설명했습니다. 단일 또는 다중 시트가 포함된 XLSX 파일을 CSV 파일로 변환하는 방법을 설명하기 위해 여러 예제와 함께 두 가지 방법에 대해 논의했습니다. 여러 XLSX 파일을 동시에 CSV 파일로 변환하는 예제를 구현했습니다. Excel에서 CSV로 데이터를 변환하는 것은 간단하거나 어려울 수 있습니다. 시트 수가 적은 파일이 하나만 있으면 간단합니다. 하지만 그렇지 않다면 어려울 수 있습니다.