파이썬 머신러닝
-
[재업]차원 축소와 주성분분석(Principal Component Analysis, PCA)파이썬 머신러닝 2024. 2. 9. 22:33
실제 현상은 여러 변수가 영향을 미치지만, 그래프로 표현할 수 있는 것은 3차원 까지이다. 그렇다면 적당히 데이터의 분포를 잘 보여주도록 차원을 축소하여 그래프로 한눈에 볼 수는 없을까? 이에 대한 답변중 하나는 주성분 분석 (Pricipal Component Anaylse, PCA)이다. 이번 포스트에서는 PCA의 수학적인 원리를 알아보고, 이를 파이썬을 이용해 구현해볼 것이다. (scikit-learn에도 주성분 분석할 수 있도록 추상화된 함수를 제공하지만, 원리를 공부하기 위해 사용하지 않았다.) 0.Prequestion아래 간단하게 고유값 분해와 특이값 분해에대해 요약을 하였는데, 이해가 되지 않는다면 공부하고 오는 것을 추천한다.고유값과 고유벡터정사각 행렬 \(A\)와 영벡터가 아닌 열벡터 \(..
-
[Matplotlib]파이썬 기본 데이터 시각화파이썬 머신러닝 2023. 12. 24. 22:15
https://matplotlib.org/ Matplotlib — Visualization with Python seaborn seaborn is a high level interface for drawing statistical graphics with Matplotlib. It aims to make visualization a central part of exploring and understanding complex datasets. statistical data visualization Cartopy Cartopy is a Python package des matplotlib.org 어떤 프로그래밍언어나 프로그램을 사용하든 데이터를 다루는 작업(통계, 수치해석, 머신러닝 등)의 결과를 보기 위해..
-
머신러닝 가이드-지도학습파이썬 머신러닝 2023. 7. 2. 15:56
인터넷을 찾아보면서 기능 하나하나를 소개하는 자료는 많지만 실제 데이터를 전처리하여, 이에 알맞는 학습 모델을 선택하고, 모델을 평가하는 전반적인 과정을 소개하는 자료는 부족한 것 같았다. 그래서 친숙한 BMI를 통해 지도학습이 어떻게 진행되는 지 소개하기로 하였다. 0.코딩 환경 구축 https://sidreco.tistory.com/14 파이썬 + VScode 머신러링 환경 구축 아나콘다 + jupyter notebook이나 google colab 등이 있지만, 아나콘다는 쓸대없이 무겁고, colab은 데이터 파일 올리기가 귀찮다. 필자는 직접 파이썬을 설치하여 pip로 필요한 패키지만 설치하는 것을 선 sidreco.tistory.com pandas(전처리), scikit-learn(학습), mat..
-
파이썬 + VScode 머신러링 환경 구축파이썬 머신러닝 2023. 7. 2. 14:49
아나콘다 + jupyter notebook이나 google colab 등이 있지만, 아나콘다는 쓸대없이 무겁고, colab은 데이터 파일 올리기가 귀찮다. 필자는 직접 파이썬을 설치하여 pip로 필요한 패키지만 설치하는 것을 선호한다. 여기서 아나콘다는 파이썬에 데이터 분석에 많이 쓰이는 패키지를 같이 설치해주는 프로그램으로 편리하긴 하지만, 이것저것 많이 깔아서 설치하는데 상당히 오래걸리고, 무겁다. (한 시간 정도) 파이썬 설치 공식 사이트 https://www.python.org/downloads/ Download Python The official home of the Python Programming Language www.python.org 특별한 이유가 없다면 노란 버튼을 눌러 최신 버전을 ..