ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 파이썬 + VScode 머신러링 환경 구축
    파이썬 머신러닝 2023. 7. 2. 14:49

    아나콘다 + jupyter notebook이나 google colab 등이 있지만, 아나콘다는 쓸대없이 무겁고, colab은 데이터 파일 올리기가 귀찮다. 필자는 직접 파이썬을 설치하여 pip로 필요한 패키지만 설치하는 것을 선호한다. 여기서 아나콘다는 파이썬에 데이터 분석에 많이 쓰이는 패키지를 같이 설치해주는 프로그램으로 편리하긴 하지만, 이것저것 많이 깔아서 설치하는데 상당히 오래걸리고, 무겁다. (한 시간 정도) 

    파이썬 설치

    공식 사이트

    https://www.python.org/downloads/

     

    Download Python

    The official home of the Python Programming Language

    www.python.org

    특별한 이유가 없다면 노란 버튼을 눌러 최신 버전을 설치하거나, 호환성을 생각하여 최신에서 하나 정도 낮은 버전을 택하면 된다. (사용할 패키지는 많이 사용되는 패키지라 호환성에 문제를 겪지는 않을 것이다.) 파이썬 설치시 환경변수에 추가 버튼을 누르는 것을 추천한다.

     

    만약에 놓쳤다면 직접 환경 변수를 추가해주어야 하는데 win + e로 파일 탐색기를 열고 내 PC를 우클릭하여 속성 버튼을 누른다.(또는 win + i -> 시스탬 탭 -> 정보 탭으로 들어가도 된다.) 

    고급 시스템 설정을 누르고

    환경 변수를 클릭한다.

    시스탬 변수에서 Path를 택하고 편집을 누른다.(컴퓨터에 로컬 계정이 하나뿐이면 사용자 변수로 해도 상관은 없다)

    새로 만들기를 눌러 파이썬이 설치된 경로와 Scripts 경로를 추가하면 된다.

    pip로 설치한 ipython 등이 제대로 작동하기 위해서는 C:\Users\(로컬 계정명)\AppData\Roaming\Python\Python311\Scripts

    이 환경 변수에 추가되어 있어야 한다.

    해당 폴더는 pip로 설치한 프로그램들이 저장되는 곳이다. 파이썬 버전을 교체할 때 주의해야할 점이 만약 환경변수에 파이썬 3.11이 등록 되어 있는데 (생략)AppData\Roaming\Python\Python310\Scripts이 환경 변수에 등록되어 있다고 하자. 그럼 pip는 3.11 꺼라 다운 했다고 뜨는데 실행시키는 것은 3.10 버전꺼라 버전 문제로 ipython 등이 실행되지 않을 것이다. 

    3.10 버전을 삭제해도 (생략)AppData\Roaming\Python\Python310\Scripts 폴더와 환경 변수는 삭제 되지 않기에 이런 문제가 발생할 가능성이 높다.(2023.9.23추가)

     

     

     

    제대로 환경변수가 설정되었다면 win+r -> cmd 입력해서 도스창을 열고 아래 명령을 입력하였을 때(PowerShell이나 git Bash를 열어도 된다.)

    파이썬 버전이 나온다.

    패키지 설치

    환경변수가 제대로 설정되었다면 cmd창, powershell, git console 등 원하는 콘솔창에 아래 명령어를 입력하여 파이썬 패키지를 설치할 수 있다.

    #패키지 설치
    pip install <패키지 명>
    
    #패키지 삭제
    pip uninstall <패키지 명>

    *컴퓨터에 여러 버전의 파이썬이 설치되어있는 경우, 환경변수에 등록된 파이썬의 pip가 실행된다. 따라서 원하는 파이썬 인터프리터의 pip를 실행시키기 위해서는 pip를 찾아가야 한다.

    이렇게 pip가 있는 경로에서 cmd를 실행시켜야 한다.

    *pip가 최신버전이 아니면 설치한 모듈이 제대로 작동하지 않을 수 있다.

    #pip upgrade 2가지 방법
    python.exe -m pip install --upgrade pip #리눅스는 사용 못함
    pip install --upgrade pip

    *pip를 업그래이드하고 다시 패키지를 install하여도 실행할 수 없다는 오류가 뜨는 경우, (생략)AppData\Roaming\Python과 이 폴더가 제대로 환경 변수에 등록되었는지, 다른 버전 파이썬이 환경 변수에 있지 않은 지 확인해볼 것

    win + R -> %appdata%에서 폴더를 확인할 수 있다.

     

    주로 사용할 패키지(라이브러리)는 아래와 같다.

    numpy 행렬과 벡터 연산을 지원하는 수학 라이브러리, 대부분 C/C++, 포트란 등으로 작성되어 기본 파이썬 리스트 보다 빠르다. 
    pandas csv, xlsx 등의 파일 불러오기와 데이터 프레임을 통해 데이터 전처리를 할 수 있는 패키지
    matplotLib 그래프 그리는 패키지
    seaborn matplotLib를 기반으로 조금 더 예쁜 그래프 그리는데 사용 (그래프 테마 기능도 있다.)
    scikit-learn 머신러닝 패키지
    tensorflow or pytorch tensorflow는 인공지능 라이브러리도 딥러링의 인공신경망이 구현되어 있다. pytorch로 딥러링 라이브러리로 대량의 데이터를 다루는데 적합하다. pytorch에서는 연산을 CPU에서 실행할지 GPU에서 실행할 지 선택할 수 있는 등 하드웨어 자원을 활용하기 좋다.

    *라이브러리를 설치하는데 pip install numpy는 안해도 되는데, numpy는 scikit-learn, tensorflow 등의 기반이 되는 라이브러리도 의존성 때문에 설치가 되어있지 않다면 자동으로 설치해주기 때문이다.

    *참고로 Jupyter Notebook을 사용하고 싶다면 pip install jupyter notebook을 하면된다.

    VScode 다운로드

    https://code.visualstudio.com/

    다운로드이후 추가작업에서

    출처&nbsp;https://crazykim2.tistory.com/748

    체크 박스를 모두 체크하는 것을 추천한다.

    특히 1,2번을 체크하지 않았다면,

    파일이나 폴더를 열때 code로 열기 메뉴가 생기지 않아 

    매번 귀찮게 이렇게 열어야 한다.

    cmd /c code .

    또는 환경 변수 Path에 추가가 되어있다면 사진처럼 명령어를 치는 것으로 대신할 수 있다. (이때 생기는 cmd 창을 닫으면 vscode도 같이 닫히니 주의)

     

    확장 탭(ctrl + shift + x) 파이썬을 검색하여 설치하면 된다.

    그리고 처음 ipynb 파일을 열게되면 ipykernel이 필요하다고 메세지가 뜨는데 yes를 누르면 된다.

    pip install ipykernel

    실수로 취소 또는 no를 눌렀다면 직접 ipykernel을 설치하면 된다. 참고로 ipykernel은 interactive python kernel을 의미한다. ipynb파일은 py 파일과 다르게 원하는 라인의 커멘드만 실행할 수 있어 파이썬 같은 인터프리터 언어의 장점을 극대화할 수 있다.

     

    자주 사용하는 단축키

    ctrl + enter 현재 선택된 커맨드 라인 실행
    B 현재 선택된 커맨드 라인 아래에 새 커맨드 라인 추가
    A 현제 선택된 커맨드 라인 위에 새 커맨드 라인 추가

    위 단축키는 반드시 커맨드 라인이 선택되어 있어야 작동하며, 커맨드 라인이 선택되면 옆에 파란색으로 표시된다. 여기서 esc를 누르거나 다른데 클릭하면 빠져나갈 수 있으며 빠져나가면 아래와 같이 표시된다.

     

    댓글

Designed by Tistory.