본문 바로가기

프로그래밍/Environment Setting

(2)
Machine Learning 프로젝트 최종 시스템 구조도 * 프로젝트 주제 : 다양한 데이터들을 묶어 학습하여, 분류 모델을 만들며 그 과정을 추출하여 모델의 합당성을 평가한다. * (다중 클래스)분류용 선형 모델 (Ex.LinearSVC, Naivebayes)의 한계 1. 타겟(등급)설정 개수의 한계 2. 다양한 데이터를 묶어 분류 모델을 만드는 특성상 데이터의 시각화 및 분석이 불가능 --> KNN, DecisionTree(RFC, GBC) 모델 사용 - KNN: 기본 모델로서 좋고 설명하기 용이 - Random Forest 1)결정 트리 하나보다 거의 항상 좋은 성능을 냄 2)매우 안정적이며 데이터 스케일 조정(전처리)필요 없음 3)주요 매개 변수 : n_estimators(사용되는 트리의 개수.클수록 안정적이며 random_state값의 변화에 따른 변..
Machine Learning 프로젝트 진행에 앞선 가상환경(Virtual Environments)의 필요성, 파이썬 라이브러리 소개 현재 진행중인 프로젝트의 대략적인 개요는 다음과 같다. 우선, 아나콘다(ANACONDA)를 통하여 가상환경(Virtual Environments)을 설정하는 이유는 각 프로젝트마다 필요한 설정을 만들어 놓은 가상환경들을 적용함으로서 통합개발환경(IDE)에 생성된 여러 프로젝트로 인해 생길 수 있는 혼동을 막을 수 있다는 것이다. 이를테면, 만일 각 프로젝트마다 가상환경 설정을 하여 프로젝트를 운용하지 않는다면 빌드 과정에서 프로젝트 설정에 대한 경로를 찾는 과정에 문제가 생길 수 있다. 장고 레스트 프레임워크(Django Rest Framework)에 대해서는 간단히 설명을 하였고(https://honeyteacs.tistory.com/6) 파이썬의 대표적인 데이터 분석, 머신러닝 라이브러리들에 대해서 ..