파이썬 knn 예제

이 알고리즘에서 두 개 이상의 매개 변수를 예측할 수 있습니다. 여기에 꽃의 홍 채 데이터 세트 유형에서 정확도가 계산됩니다. 예를 들어 색상에 대한 매개 변수를 하나 더 추가하면 꽃 유형과 색상을 모두 예측할 수 있으며 동시에 정확도가 향상될 수 있습니까? 안녕하세요, 지금까지 좋은 튜토리얼. 나는 파이썬초보자이고 getNeighbours 함수에서 다음과 같은 오류에 갇혀 있습니다 : 코드로도 이러한 데이터 집합을 분류 할 수 있습니까?? 파이썬의 다른 분류자 코드 예제가 있으면 저를 제공하십시오 … 아래 예제에서는 scikit-learn 라이브러리를 사용하여 홍채 데이터 집합에 대한 KNN 구현을 보여 주실 수 있습니다. 홍채 데이터 세트는 홍채 꽃의 각 다른 종에 대한 50 샘플이 있습니다 (총 150). 각 샘플에 대해 우리는 sepal 길이, 너비와 꽃잎 길이와 폭과 종 이름 (클래스 / 라벨)이 있습니다. 이 섹션에서는 파이썬의 Scikit-Learn 라이브러리를 사용하여 20줄 미만의 코드로 KNN 알고리즘을 구현하는 방법을 살펴보겠습니다. Scikit 학습 라이브러리에 대한 다운로드 및 설치 지침은 여기에서 확인할 수 있습니다. KNN 알고리즘의 명백한 단점 중 하나는 업계 환경에서 비실용적인 계산 비용이 많이 드는 테스트 단계입니다.

KNN과 매우 빠른 테스트 단계이기는 하지만 긴 훈련 단계를 가진 보다 정교한 신경망 사이의 엄격한 이분법을 참고하십시오. 또한 KNN은 왜곡된 클래스 분포로 인해 어려움을 겪을 수 있습니다. 예를 들어, 특정 클래스가 학습 집합에서 매우 빈번한 경우 새 예제의 과반수 투표를 지배하는 경향이 있습니다(큰 숫자 = 더 일반적). 마지막으로, 가장 가까운 이웃과 가장 먼 이웃 사이에 차이가 거의 없기 때문에 높은 차원 의 데이터로 KNN의 정확도가 심각하게 저하될 수 있습니다. 알 수 없는 물체 « UO »의 부근에서 k 항목만 살펴보고 과반수 투표를 했습니다. 다수결 투표를 사용하는 것은 우리의 이전 예에서 매우 효율적인 것으로 나타났습니다,하지만 이 계정에 다음과 같은 추론을 고려하지 않았다 : 이웃이 멀리, 더 « 실제 »결과에서 « 이탈 ». 또는 다른 말로 하면, 우리는 더 먼 이웃보다 가장 가까운 이웃을 더 신뢰할 수 있습니다. 알 수 없는 항목 UO의 11명의 이웃이 있다고 가정해 봅시다. 가장 가까운 5개의 이웃은 클래스 A에 속하며, 다른 6개는 모두 멀리 떨어져 있는 클래스 B에 속합니다. UO에 어떤 클래스를 할당해야 합니까? 이전 접근 방식은 B에 찬성 6~5표가 있기 때문에 B라고 합니다.