PyTorch를 사용하여 데이터 세트를 반복하고 시각화하는 방법은 무엇입니까?

Pytorchleul Sayonghayeo Deiteo Seteuleul Banboghago Sigaghwahaneun Bangbeob Eun Mueos Ibnikka



PyTorch는 사용자가 신경망을 생성/구축하고 훈련할 수 있는 딥러닝 프레임워크입니다. 데이터 세트는 데이터 샘플 및 레이블의 세트/컬렉션을 포함하는 데이터 구조입니다. 이는 데이터 전체에 액세스하거나 인덱싱 및 슬라이싱 작업을 사용하는 방법을 제공합니다. 또한 데이터세트는 자르기, 크기 조정 등과 같은 데이터 변환을 데이터에 적용할 수도 있습니다. 사용자는 PyTorch에서 데이터세트를 쉽게 반복하고 시각화할 수 있습니다.

이 글에서는 PyTorch를 사용하여 특정 데이터 세트를 반복하고 시각화하는 방법을 설명합니다.







PyTorch를 사용하여 데이터 세트를 반복하고 시각화하는 방법은 무엇입니까?

PyTorch를 사용하여 특정 데이터세트를 반복하고 시각화하려면 제공된 단계를 따르세요.



1단계: 필요한 라이브러리 가져오기



먼저 필요한 라이브러리를 가져옵니다. 예를 들어 다음 라이브러리를 가져왔습니다.





수입 토치
torch.utils.data에서 데이터세트 가져오기
torchvision 가져오기 데이터세트에서
torchvision.transforms에서 ToTensor 가져오기
matplotlib.pyplot 가져오기 ~처럼 plt


여기:

    • 수입 토치 ”는 PyTorch 라이브러리를 가져옵니다.
    • torch.utils.data에서 데이터세트 가져오기 '는 PyTorch에서 사용자 정의 데이터 세트를 생성하기 위해 PyTorch의 'torch.utils.data' 모듈에서 'Dataset' 클래스를 가져옵니다.
    • torchvision 가져오기 데이터세트에서 ”는 컴퓨터 비전 작업을 위해 사전 정의된 데이터세트를 제공하는 “torchvision” 라이브러리에서 “datasets” 모듈을 가져옵니다.
    • torchvision.transforms에서 ToTensor 가져오기 ”는 PIL 이미지 또는 NumPy 배열을 PyTorch 텐서로 변환하기 위해 “torchvision.transforms”에서 “ToTensor” 변환을 가져옵니다.
    • matplotlib.pyplot을 plt로 가져오기 '는 데이터 시각화를 위해 matplotlib 라이브러리를 가져옵니다.


2단계: 데이터세트 로드

이제 다음 매개변수를 사용하여 훈련 및 테스트 목적으로 torchvision에서 FashionMNIST 데이터세트를 로드합니다.

tr_data = 데이터세트.FashionMNIST ( 뿌리 = '데이터' , 기차 =사실, 다운로드 =사실, 변환 =Tensor로 ( )
)

ts_data = 데이터 세트.FashionMNIST ( 뿌리 = '데이터' , 기차 =거짓, 다운로드 =사실, 변환 =Tensor로 ( )
)


여기:

    • 패션MNIST ”는 torchvision 라이브러리에서 FashionMNIST 데이터세트를 로드합니다.
    • 루트=”데이터” ”는 데이터세트가 이미 존재하는 경우 데이터세트가 저장되거나 로드될 디렉터리를 지정합니다. 우리의 경우에는 'data' 디렉터리입니다.
    • 기차 ”는 훈련 또는 테스트 데이터 세트를 나타냅니다.
    • 다운로드=참 ” 데이터 세트가 아직 없는 경우 다운로드합니다.
    • 변환=ToTensor() ”는 ToTensor 변환을 적용하여 데이터 세트의 이미지를 PyTorch 텐서로 변환합니다.


3단계: 데이터세트의 클래스에 라벨 지정

다음으로, 클래스 인덱스를 FashionMNIST 데이터세트의 해당 클래스 레이블에 매핑하는 사전을 만듭니다. 각 클래스에 대해 사람이 읽을 수 있는 레이블을 제공합니다. 여기에서 우리는 “ mapped_label ” 사전을 사용하여 클래스 인덱스를 해당 클래스 레이블로 변환합니다.

mapped_label = {
0 : '티셔츠' ,
1 : '바지' ,
2 : '풀오버' ,
: '드레스' ,
4 : '코트' ,
5 : '샌들' ,
6 : '셔츠' ,
7 : '고무창 운동화' ,
8 : '가방' ,
9 : '발목 부츠' ,
}



4단계: 데이터 세트 시각화

마지막으로 'matplotlib' 라이브러리를 사용하여 훈련 데이터의 샘플을 시각화합니다.

fig = plt.그림 ( 무화과 크기 = ( 8 , 8 ) )
안부 , 행 = ,
~을 위한 ~에 범위 ( 1 , 안부 * 행 + 1 ) :
Sample_index = 토치.randint ( 오직 ( tr_날짜 ) , 크기 = ( 1 , ) ) .안건 ( )
img, 라벨 = tr_data [ 샘플_인덱스 ]
fig.add_subplot ( 열, 안부 , 나 )
plt.제목 ( mapped_label [ 상표 ] )
plt.축 ( '끄다' )
plt.imshow ( img.squeeze ( ) , cmap = '회색' )
plt.show ( )





메모 : 여기에서 Google Colab Notebook에 액세스할 수 있습니다. 링크 .

이는 PyTorch를 사용하여 원하는 데이터 세트를 반복하고 시각화하는 것이었습니다.

결론

PyTorch를 사용하여 특정 데이터 세트를 반복하고 시각화하려면 먼저 필요한 라이브러리를 가져옵니다. 그런 다음 필수 매개변수를 사용하여 훈련 및 테스트를 위해 원하는 데이터세트를 로드합니다. 다음으로, 데이터 세트의 클래스에 레이블을 지정하고 'matplotlib' 라이브러리를 사용하여 훈련 데이터의 샘플을 시각화합니다. 이 글에서는 PyTorch를 사용하여 특정 데이터 세트를 반복하고 시각화하는 방법을 설명했습니다.