머신러닝+딥러닝
-
[혼공머신] 5주차 과제 - 비지도 학습AI/혼공학습단9기_DL&ML 2023. 2. 1. 20:02
1. Contents 1) 군집 알고리즘(Clustering) Unsupervised Learning(비지도학습)은 머신러닝의 한 종류로 훈련 데이터에 타겟이 없음. 따라서 외부 도움 없이 스스로 학습해야 함. 대표적인 비지도학습은 Clustering(군집), Dimension Reduction(차원 축소: PCA, tSNE 등)이 있음. Clustering(군집)은 비슷한 샘플끼리 하나의 그룹으로 모으는 대표적인 비지도 학습임. 군집 알고리즘으로 모은 샘플 그룹을 Cluster라고 부름. Histogram(히스토그램: hist())은 구간별로 값이 발생한 빈도를 그래프로 표시한 것. 보통 x축이 값의 구간이고 y축은 발생 빈도임. 2) K-MEANS K-Means(K-평균) 알고리즘은 처음에 랜덤하게 ..
-
[혼공머신] 4주차 과제 - 트리 알고리즘AI/혼공학습단9기_DL&ML 2023. 1. 26. 20:14
1. Contents 1) Decision Tree(결정 트리) Decision Tree(결정 트리)는 예 / 아니오에 대한 질문을 이어나가면서 정답을 찾아 학습하는 알고리즘으로서, 비교적 예측 과정을 이해하기 쉽고 성능도 뛰어남. Impurity(불순도)는 결정 트리가 최적의 질문을 찾기 위한 기준. Scikit-learn에는 Gini Impurity와 Entropy Impurity가 있음. 노드에서 데이터를 분할할 기준을 criterion이라고 하며, DecisionTreeClassifier 클래스의 criterion 매개변수의 기본 값이 "gini"임. Gini Impurity(지니 불순도)는 "1 - (음성 클래스 비율^2 + 양성 클래스 비율^2)"로 계산하며, 0.5가 나올 경우 클래스의 비율..
-
[혼공머신] 3주차 과제 - 다양한 분류 알고리즘AI/혼공학습단9기_DL&ML 2023. 1. 19. 09:23
1. Contents Logistic Regression(로지스틱 회귀): 선형 방정식을 사용한 분류 알고리즘. 선형 회귀와 달리 Sigmoid 나 Softmax function을 사용하여 클래스 확률을 출력할 수 있음. Solver 매개변수에서 사용할 알고리즘을 선택할 수 있음 Sover 매개변수의 기본값은 'lbfgs'임. 'sag'는 확률적 평균 하강법 알고리즘으로서, 특성과 샘플수가 많을 때 성능이 좋고 빠른 매개변수임. Overfitting(과대적합)이 되었을 경우 'sag'알고리즘으로 변경 고려. 'penalty'매개변수에서 L2규제(릿지)와 L1규제(라쏘)를 선택할 수 있음(기본값: l2 (L2규제)) 'C' 매개변수에서 규제 강도를 제어하며 기본값은 1.0임(숫자가 작을 수록 규제 강함)...