본문 바로가기

프로그래밍

(18)
[Machine Learning] 지도 학습(Supervised Learning)이란? 지도 학습(Supervised Learning)이란? 앞선 '인공 지능(Artificial Intelligence), 머신 러닝(Machine Learning), 딥 러닝(Deep Learning) 란?'(https://honeyteacs.tistory.com/8)에서도 간단히 설명하였듯이 입력에 대한 출력(답)이 정해진 데이터들을 알고리즘에 학습시켜 주어진 입력에 대한 출력을 만드는 방법을 말한다. 즉, 훈련세트로부터 만들어진 모델을 통하여 새로운 데이터에 대한 정확한 출력을 예측하는 것이다. 지도 학습의 종류는 분류(classification)와 회귀(regression)로 나눌 수 있다. 1) 분류 : 두 개의 클래스로 나뉘어지는 이진 분류와 셋 이상의 클래스로 나뉘어지는 다중 분류로 나눌 수 있다..
파이참(Pycharm)과 깃 허브(GitHub) 연동하기(Mac OS) 1. 깃 허브(GitHub) 회원 가입 https://github.com Build software better, together GitHub is where people build software. More than 36 million people use GitHub to discover, fork, and contribute to over 100 million projects. github.com 가장 먼저 위 깃 허브(GitHub) 페이지에 들어가서 회원가입을 해준다. 2. 저장소(Repository) 만들기 다음으로는 프로젝트를 저장할 저장소(Repository)를 만들어 준다. 저장소의 이름을 만들어주고 해당 저장소를 모두에게 공개할(Public) 것인지, 제한할(Private) 것인지를 결정할..
[Machine Learning] k-NN(KNN, k-Nearest Neighbor, k-최근접 이웃) 알고리즘을 활용한 머신러닝 모델 만들기 k-NN(KNN, K-Nearest Neighbor, k-최근접 이웃 알고리즘) : 새로운 데이터가 주어졌을 때, 훈련 데이터(training set)에서 새로운 데이터에 가장 가까운 k개의 이웃을 찾는 알고리즘 싸이킷런(scikit-learn)에서의 k-Nearest Neighbor 알고리즘은 neighbors 모듈 아래 KNeighborsClassifier 클래스에 구현되어있다. 따라서 K-Nearest Neighbor 알고리즘은 KNeighborsClassifier 클래스를 통해 객체를 만들어 사용할 수 있는데, 이때 매개변수로 찾고자 하는 이웃의 개수(n_neighbors)를 지정해 줄 수 있다. (아래의 경우 편의를 위하여 n_neigbors의 값을 1로 지정) 다음으로 앞서 생성하였던 훈련 데..
[Machine Learning] 머신러닝 알고리즘(Machine Learning Algorithm) 적용에 앞선 데이터 분석 데이터 셋(dataset)을 대상으로 머신러닝 알고리즘(지도 학습(Supervised Learning))을 적용하기에 앞서 다음 세 가지를 평가해야 한다. (인공 지능(Artificial Intelligence),머신 러닝(Machine Learning),딥 러닝(Deep Learning) 이란?: https://honeyteacs.tistory.com/8) 1. 해당 데이터 셋이 가지고 있는 키 값들(keys)이 무엇인지 2. 해당 데이터 셋 중 어느 것들을 머신러닝 모델을 만드는데 사용할 training set으로 사용할 것이며, 어느 것들을 모델이 잘 작동하는지를 평가하는 test set으로 사용할 것인지 3. training set을 기반으로한 출력값(클래스)들이 training set의 특성들에..
Machine Learning 프로젝트 진행에 앞선 가상환경(Virtual Environments)의 필요성, 파이썬 라이브러리 소개 현재 진행중인 프로젝트의 대략적인 개요는 다음과 같다. 우선, 아나콘다(ANACONDA)를 통하여 가상환경(Virtual Environments)을 설정하는 이유는 각 프로젝트마다 필요한 설정을 만들어 놓은 가상환경들을 적용함으로서 통합개발환경(IDE)에 생성된 여러 프로젝트로 인해 생길 수 있는 혼동을 막을 수 있다는 것이다. 이를테면, 만일 각 프로젝트마다 가상환경 설정을 하여 프로젝트를 운용하지 않는다면 빌드 과정에서 프로젝트 설정에 대한 경로를 찾는 과정에 문제가 생길 수 있다. 장고 레스트 프레임워크(Django Rest Framework)에 대해서는 간단히 설명을 하였고(https://honeyteacs.tistory.com/6) 파이썬의 대표적인 데이터 분석, 머신러닝 라이브러리들에 대해서 ..
[Machine Learning] 인공 지능(Artificial Intelligence), 머신 러닝(Machine Learning), 딥 러닝(Deep Learning) 이란? 인공 지능 (Artificial Intelligence) 머신 러닝과 딥 러닝을 포괄하는 개념으로서, 인간만이 할 수 있다고 믿었던 생각과 행동들을 컴퓨터가 수행하게 하는 것을 목표로 하는 일련의 소프트웨어, 논리, 사고 등을 말한다. 매우 포괄적인 의미를 지니며 특정 기술 분야의 이름이 아니라 지능적인 요소를 가진 모든 것들을 말하기도 한다. 머신 러닝 (Machine Learning) 인공지능 분야의 일부로서, 기계학습이라고도 불린다. 기계(컴퓨터)가 직접 데이터를 학습하여 새로운 데이터가 주어졌을 때, 이를 학습된 모델을 기반으로 평가를 하는 것을 뜻한다; 데이터로부터 지식을 추출하는 작업 (데이터를 이용한 모델링 기법) 머신 러닝은 출력(답)이 주어지는가 아닌가에 따라 두 가지 유형으로 존재한다...
Django Rest Framework 로 Scikit-Learn(사이킷런) 학습 및 예측 어플리케이션 웹상에서 이용하기 우선 학습 모델들을 저장할 디렉토리(models)를 만들어 주자 1. settings.py에 models루트 추가 및 INSTALLED APPS에 rest_framework 와 앞서 만든 어플리케이션(analysis_web) 추가 2. 프로젝트와 어플리케이션 각각의 urls.py 설정 3. 학습 모델 생성 및 이를 기반으로 한 예측(views.py) 데이터 : sklearn 라이브러리의 iris datasets 모듈 (load_iris 사용하여 데이터 적재) 학습 알고리즘 : RandomForestClassifier 학습과 예측에 이용될 매개변수 전송방식 : json 형태로 post 함수(json 형태로 더 많은 매개변수들을 담아 보낼 수 있다)를 통하여 전송 Train class : iris datas..
아나콘다(Anaconda) 가상환경에 라이브러리 설치하기(MacOS) 아나콘다 네비게이터(ANACONDA NAVIGATOR)에서 설치한 가상 환경 클릭 검색 조건을 All 로 한 후, 설치를 원하는 라이브러리 검색 후 Apply 1. pandas 2. scikit-learn (마찬가지로 scipy도 함께 설치됨) 3. djangorestframework 설치