혼공
-
[혼공머신] 5주차 과제 - 비지도 학습AI/혼공학습단9기_DL&ML 2023. 2. 1. 20:02
1. Contents 1) 군집 알고리즘(Clustering) Unsupervised Learning(비지도학습)은 머신러닝의 한 종류로 훈련 데이터에 타겟이 없음. 따라서 외부 도움 없이 스스로 학습해야 함. 대표적인 비지도학습은 Clustering(군집), Dimension Reduction(차원 축소: PCA, tSNE 등)이 있음. Clustering(군집)은 비슷한 샘플끼리 하나의 그룹으로 모으는 대표적인 비지도 학습임. 군집 알고리즘으로 모은 샘플 그룹을 Cluster라고 부름. Histogram(히스토그램: hist())은 구간별로 값이 발생한 빈도를 그래프로 표시한 것. 보통 x축이 값의 구간이고 y축은 발생 빈도임. 2) K-MEANS K-Means(K-평균) 알고리즘은 처음에 랜덤하게 ..
-
[혼공머신] 4주차 과제 - 트리 알고리즘AI/혼공학습단9기_DL&ML 2023. 1. 26. 20:14
1. Contents 1) Decision Tree(결정 트리) Decision Tree(결정 트리)는 예 / 아니오에 대한 질문을 이어나가면서 정답을 찾아 학습하는 알고리즘으로서, 비교적 예측 과정을 이해하기 쉽고 성능도 뛰어남. Impurity(불순도)는 결정 트리가 최적의 질문을 찾기 위한 기준. Scikit-learn에는 Gini Impurity와 Entropy Impurity가 있음. 노드에서 데이터를 분할할 기준을 criterion이라고 하며, DecisionTreeClassifier 클래스의 criterion 매개변수의 기본 값이 "gini"임. Gini Impurity(지니 불순도)는 "1 - (음성 클래스 비율^2 + 양성 클래스 비율^2)"로 계산하며, 0.5가 나올 경우 클래스의 비율..
-
[혼공머신] 3주차 과제 - 다양한 분류 알고리즘AI/혼공학습단9기_DL&ML 2023. 1. 19. 09:23
1. Contents Logistic Regression(로지스틱 회귀): 선형 방정식을 사용한 분류 알고리즘. 선형 회귀와 달리 Sigmoid 나 Softmax function을 사용하여 클래스 확률을 출력할 수 있음. Solver 매개변수에서 사용할 알고리즘을 선택할 수 있음 Sover 매개변수의 기본값은 'lbfgs'임. 'sag'는 확률적 평균 하강법 알고리즘으로서, 특성과 샘플수가 많을 때 성능이 좋고 빠른 매개변수임. Overfitting(과대적합)이 되었을 경우 'sag'알고리즘으로 변경 고려. 'penalty'매개변수에서 L2규제(릿지)와 L1규제(라쏘)를 선택할 수 있음(기본값: l2 (L2규제)) 'C' 매개변수에서 규제 강도를 제어하며 기본값은 1.0임(숫자가 작을 수록 규제 강함)...
-
[혼공머신] 2주차 과제 - 회귀모델AI/혼공학습단9기_DL&ML 2023. 1. 12. 06:51
1. 2주차 Contents - 회귀(Regression): 타겟값(임의의 수치)를 예측하는 기법 - KNeighborsRegressor(): 가장 가까운 이웃 샘플을 찾고 이 샘플들의 타겟값을 평균하여 예측. n_nighbors 매개변수로 이웃의 개수를 지정하며 기본값은 5. - mean_absolute_error(): 평균 절대값 오차. 첫 번째 매개변수는 타겟, 두 번째 매개변수는 예측값을 전달하며 비슷한 개념의 평균 제곱 오차(mean_squared_error())는 이에 제곱근을 을 씌운 개념임. - reshape(): 배열의 크기를 바꾸는 메서드 - 결정계수(R2): 회귀문제 성능 측정도구. 1에 가까울 수록 성능이 좋은 모델 - 과대적합(Overfitting): 모델이 trainset에 너무..
-
[혼공머신] 1주차 과제 - 데이터 전처리, 훈련/시험세트AI/혼공학습단9기_DL&ML 2023. 1. 8. 06:57
1. 1주차 Contents 1) 인공지능, 머신러닝, 딥러닝 2) 코랩, 노트북, 구글드라이브 (1) 코랩 텍스트 셀 툴바 (2) 텍스트 셀에 사용할 수 있는 마크다운 3) 특성, 훈련, KNeighborsClassifier(K-최근접 이웃 알고리즘), 모델, 정확도 (1) matplotlib (2) sk-learn 4) 지도학습, 비지도학습, 훈련세트, 테스트세트 (1) numpy (2) seed() (3) arrange() (4) shuffle() 5) 데이터 전처리, 표준점수, 브로드캐스팅 (1) sckit-learn (2) train_test_split() (3) kneighbors() 2. 기본 미션 : 코랩 실습 캡쳐 3. 선택 미션 1) 머신러닝 알고리즘의 한 종류로서 샘플의 입력과 타깃을..