fitdist를 사용하여 MATLAB에서 정규분포 작업을 수행하는 방법

Fitdistleul Sayonghayeo Matlabeseo Jeong Gyubunpo Jag Eob Eul Suhaenghaneun Bangbeob



정규 분포 인공 지능, 데이터 과학, 기계 학습 및 기타 여러 분야에서 널리 사용되는 통계 기법입니다. 평균이 대칭인 확률분포로, 그래프에서 나타나는 모양 때문에 가우스 분포라고도 합니다. 이는 평균에 가까운 데이터 값이 평균에서 멀리 있는 데이터 값보다 더 자주 발생함을 보여줍니다. 그래프에서 정규 분포는 종형 곡선을 형성합니다.

데이터 세트의 정규 분포를 찾는 것은 쉬운 일이 아닙니다. 그러나 다음을 사용하여 MATLAB에서 이를 수행할 수 있습니다. 적합도() 기능. 이 가이드를 읽고 정규 분포 MATLAB에서 적합도() 기능.

정규분포란?

정규 분포 가우스 분포라고도 불리는 이 분포는 두 개의 매개변수를 사용하여 정의됩니다. 데이터 포인트의 평균 및 표준 편차. 평균은 데이터 값의 평균을 측정하는 반면, 표준편차는 데이터 값이 평균 주위에 어떻게 퍼져 있는지를 측정합니다. 평균과 표준편차를 조합하여 다음을 계산할 수 있습니다. 정규 분포 다음 공식에서 :









어디:



  • 엑스 데이터 세트 값을 나타냅니다.
  • 에프엑스(f(x)) 확률 함수를 나타냅니다.
  • 을 나타냅니다
  • 표준편차를 나타낸다.

fitdist() 함수를 사용하여 MATLAB에서 정규분포를 수행하는 방법

MATLAB을 사용하면 다음을 계산할 수 있습니다. 정규 분포 내장을 사용한 무작위 변수 적합도() 기능. 이 기능은 정규 확률 분포 주어진 분포를 입력 데이터에 맞춰 객체를 생성합니다. 그만큼 정규 분포 표준편차와 평균이라는 두 가지 매개변수를 입력으로 받아들입니다. 표준 정규 분포는 평균값이 0이고 단위 표준 편차가 1입니다. 이는 정규 분포 는 0을 중심으로 하고 분포 값은 평균의 양쪽에 균등하게 분산됩니다.





통사론

그만큼 적합도() MATLAB에서는 다양한 방식으로 사용될 수 있습니다.



PD = 적합자 ( 엑스 , distname )
PD = 적합자 ( 엑스 , distname , 이름 , )
PDCA , GN , ] = 적합자 ( 엑스 , distname , '에 의해' , 그룹바 )

여기:

  • 함수 pd = 적합 거리(x, 거리 이름) 확률 분포 객체를 생성하기 위해 distname에서 제공한 분포를 열 벡터 x에 포함된 데이터에 맞추는 일을 담당합니다.
  • 함수 pd = fitdist(x,distname,이름,값) 추가 매개변수를 지정하는 하나 이상의 이름-값 쌍 인수를 사용하여 확률 분포 객체를 구축하는 일을 담당합니다.
  • 함수 [pdca,gn,gl] = fitdist(x,distname,'By',groupvar) 확률 분포 객체를 생성하기 위해 그룹화 변수 groupvar를 기반으로 distname으로 정의된 확률 분포를 열 벡터 x의 데이터에 맞추는 일을 담당합니다. 이는 pdca로 표시되는 적합 확률 분포 객체의 셀 배열, gn으로 표시되는 그룹 레이블의 셀 배열, gl로 표시되는 그룹화 변수 수준의 셀 배열을 반환합니다.

예제 1: fitdist(x,distname) 함수를 사용하여 정규분포를 찾는 방법

이 예는 정규 분포 다음을 사용하여 샘플 데이터 z에 적합도() 기능.

환자를 태우다
와 함께 = 무게 ;
PD = 적합자 ( 와 함께 , '정상' )

예제 2: fitdist(x,distname,Name,Value)를 사용하여 정규 분포를 찾는 방법 기능

이 예에서는 다음을 사용하여 커널 분포를 샘플 데이터에 맞추겠습니다. 적합도() MATLAB의 함수.

환자를 태우다
와 함께 = 무게 ;
PD = 적합자 ( 와 함께 , '핵심' , '핵심' , '에파네치니코프' )

예제 3: fitdist(x,distname,'By',groupvar) 함수를 사용하여 정규 분포를 찾는 방법

아래 제공된 MATLAB 코드는 적합합니다. 정규 분포 그룹화된 데이터에 대해 두 데이터 그룹의 pdf를 계산하고 플롯합니다.

환자를 태우다
와 함께 = 무게 ;
[ PDCA , GN , ] = 적합자 ( 와 함께 , '정상' , '에 의해' , 성별 )
여성 = PDCA { 1 }
남성 = PDCA { 2 }
z_값 = 80 : 1 : 220 ;
여자pdf = PDF ( 여성 , z_값 ) ;
남자pdf = PDF ( 남성 , z_값 ) ;
수치
구성 ( z_값 , 여자pdf , '선의 폭' , 2 )
기다리다
구성 ( z_값 , 남자pdf , '색상' , '아르 자형' , '라인스타일' , ':' , '선의 폭' , 2 )
전설 ( GN , '위치' , '북동' )
보류하다

결론

찾기 정규 분포 데이터 세트는 기계 학습, 인공 지능, 데이터 과학 및 기타 여러 분야에서 널리 사용되는 통계 기술입니다. 두 개의 매개변수를 사용하여 정의할 수 있습니다. 데이터 포인트의 평균 및 표준 편차. 우리는 데이터 세트를 정규 분포 를 사용하는 객체 적합도() 기능. 이 가이드에서는 다음의 기본 사항을 제공했습니다. 정규 분포 함수와 MATLAB에서 함수를 사용하여 작업하는 방법 적합도() 기능.