본문 바로가기

[Machine Learning] k-NN(KNN, k-Nearest Neighbor, k-최근접 이웃), KNN-Regression(k-최근접 이웃 회귀) 알고리즘 - 여러개의 이웃 선택하기 전에 살펴본 이웃의 개수가 1일 경우에(n_neighbors = 1), 테스트 데이터가 어떤 클래스에 속할지에 대한 예측은 단순히 테스트 데이터에 가장 가까운 훈련 데이터의 출력을 기준으로 예측하는 것이었다.(https://honeyteacs.tistory.com/12?category=688750) 하지만 이웃의 개수가 1이 아닌 여러개일(n_neighbors = k) 경우에는 각 이웃이 속하는 클래스를 따져본 후, 가장 많은 이웃이 속하는 클래스를 선택하는 방식으로 클래스를 예측하게 된다. * 이웃의 수가 적을 수록 모델은 복잡해진다. - 훈련 데이터 예측 정확도 상승, 테스트 데이터 정확도 하락 - 극단적인 경우, 최근접 이웃의 수가 하나일 경우 훈련 데이터 예측률은 100%라 할 수 있지만 테스트 ..
포트폴리오(Portfolio), CMA(Cash Management Account)란? 포트폴리오(Portfolio) : 재무 목표를 달성하기 위한 투자상품(예적금, 펀드, 주식, 부동산 등) 및 금액을 정리해 놓은 것 20~30대에는 주로 공격적인 투자(펀드, 주식 등)를 할 필요가 있고 나이가 들 수록 부동산 자산을 늘려가며 CMA나 예적금 등의 안정적인 투자를 해야한다. *CMA(Cash Management Account) : 종합자산관리계좌라고 불리는 통장으로서 증권사나 종합금융회사에서 제공하는 수시 입출금 통장이다. 일반적으로 은행에서 만들 수 있는 입출금 통장에서 제공하는 기능을 모두 담고 있는 통장일 뿐만 아니라 비교적 높은 금리를 지원해준다. CMA의 장점 1) 일반 입출금통장보다 10배 높은 금리 - 일반 입출금통장 월 금리(0.1~0.2%), CMA 금리(1.1~1.2%)..
쉘(Shell), 쉘 스크립트(Shell Script)이란? 쉘(Shell) : 운영 체제가 제공하는 명령들을 사용할 수 있게 해주는 커맨드 라인 인터페이스(command line interface). 대표적으로 유닉스 환경의 주류인 bash가 있다. 쉘 스크립트(Shell Script) : 쉘이 일련의 명령을 스크립트에 적힌 순서대로 실행하도록 하는 텍스트 파일 쉘의 첫 작업은 홈 디렉토리(echo $HOME으로 확인 가능)에 있는 로그인 스크립트(운영체제에 따라 .login, .profile, .bash_profile, .bashrc 중 하나)를 읽고 그 안의 명령을 실행하는 것이다. 앞으로 임의로 지정한 폴더에 새롭게 만들어질 스크립트들을 쉽게 참조하게 하기 위하여 해당 디렉토리를 PATH에 넣어 줄 필요가 있다. 이를 위하여 로그인 스크립트에 해당 폴더의 ..
[Machine Learning] 지도 학습(Supervised Learning)이란? 지도 학습(Supervised Learning)이란? 앞선 '인공 지능(Artificial Intelligence), 머신 러닝(Machine Learning), 딥 러닝(Deep Learning) 란?'(https://honeyteacs.tistory.com/8)에서도 간단히 설명하였듯이 입력에 대한 출력(답)이 정해진 데이터들을 알고리즘에 학습시켜 주어진 입력에 대한 출력을 만드는 방법을 말한다. 즉, 훈련세트로부터 만들어진 모델을 통하여 새로운 데이터에 대한 정확한 출력을 예측하는 것이다. 지도 학습의 종류는 분류(classification)와 회귀(regression)로 나눌 수 있다. 1) 분류 : 두 개의 클래스로 나뉘어지는 이진 분류와 셋 이상의 클래스로 나뉘어지는 다중 분류로 나눌 수 있다..
[DB] 데이터베이스(Database)의 종류 데이터베이스(Database)의 종류는 크게 관계형 데이터베이스(RDB)와 NoSQL(Not Only SQL)로 나뉜다. 1. 관계형 데이터베이스(RDB) - 아직까지도 가장 많이 사용되는 데이터베이스로서 흔히 행(Column)과 열(Row)로 표현되는 테이블간의 관계를 나타낼 때 사용되며, 이렇게 표현된 데이터베이스는 SQL을 통하여 관리 및 접근한다. [RDB 종류] Oracle, MySQL(Oracle) / MS-SQL(Microsoft) / DB2, Infomix(IBM) / Maria DB(Sun Microsystems) / Derby(Apache) / SQLite(Opensource) *SQLite: 로컬에서 사용하는 경량 데이터베이스로서 원격 Connection이 발생하지 않으므로 속도가 매..
[DB] SQL이란? + DDL, DML, DCL, TCL 이란? SQL(Structured Query Language) : 관계형 데이터베이스에 대하여 데이터의 구조를 정의, 데이터 조작, 제어 등을 할 수 있게 해주는 절차형 언어 (Schema, Domain, Table, View, Index에 적용) *SQL은 ANSI/ISO 표준을 따르기 때문에 데이터베이스 관리 시스템이 변경되어도 그대로 사용 가능하다. SQL은 크게 DDL, DML, DCL, TCL 4가지 종류로 나눌 수 있다. 1. DDL(Data Definition Language) : 데이터 구조를 정의하는 언어 - 데이터의 구조에 대한 생성, 삭제, 변경, 이름 변경 - Create, Drop, Truncate(모든 행 삭제), Alter, Rename, Comment - Oracle 10g 이전 버..
[Linux] crontab(크론탭) 설정 및 사용법 crontab(크론탭) 이란? 윈도우 스케쥴러와 비슷한 도구 중 하나로, 미래 임의의 시간에 작업을 실행하거나 일정한 시간(매분, 매시간, 매달, 매해)마다 자동으로 작업을 실행할 수 있도록 해주는 리눅스 도구 (/var/spool/cron/ID에 위치) 1. crontab 설정을 위한 리눅스 명령어 1) crontab -e : crontab 설정을 위한 vi editor 열기(설정 후 빠져나오면 cron 데몬을 따로 돌릴 필요없이 바로 적용 됨) 2) crontab -l : 설정된 crontab 정보 보기 3) crontab -r : crontab 삭제 4) ps -eflgrep cron : cron demon이 돌고 있는지 확인 5) kill -9 "pid of cron" : kill cron dem..
파이참(Pycharm)과 깃 허브(GitHub) 연동하기(Mac OS) 1. 깃 허브(GitHub) 회원 가입 https://github.com Build software better, together GitHub is where people build software. More than 36 million people use GitHub to discover, fork, and contribute to over 100 million projects. github.com 가장 먼저 위 깃 허브(GitHub) 페이지에 들어가서 회원가입을 해준다. 2. 저장소(Repository) 만들기 다음으로는 프로젝트를 저장할 저장소(Repository)를 만들어 준다. 저장소의 이름을 만들어주고 해당 저장소를 모두에게 공개할(Public) 것인지, 제한할(Private) 것인지를 결정할..