Notice
Recent Posts
Recent Comments
Link
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
Archives
Today
Total
관리 메뉴

hosi_stella

[혼공학습단 8기] 1주차 본문

혼자공부하는 머신러닝+딥러닝

[혼공학습단 8기] 1주차

hosi_stella 2022. 7. 10. 21:36

1주차

 

기본 미션: 코랩 실습 화면 캡쳐하기

데이터 편향 극복하기:


선택미션: Ch.02(02-1) 확인문제 풀고, 풀이 과정 정리하기

 

1. 머신러닝 알고리즘의 한 종류로서 샘플의 입력과 타깃(정답)을 알고 있을 때 사용할 수 있는 학습 방법은 무엇인가요?

① 지도 학습 - input(data), target(정답)으로 모델 학습하는 알고리즘 

❌② 비지도 학습 - 타깃 없이 입력데이터만 사용하는 알고리즘 

❌③ 차원 축소 - 데이터의 의미를 제대로 표현하는 특징을 파악하여 중요한 특성만 선택하여 특성의 개수를 줄이는 방법

❌④ 강화 학습 - 알고리즘이 행동한 결과로 얻은 보상으로 학습하는 알고리즘 

 

2. 훈련 세트와 테스트 세트가 잘못 만들어져 전체 데이터를 대표하지 못하는 현상을 무엇이라고 부르나요?

❌① 샘플링 오류

❌② 샘플링 실수

❌③ 샘플링 편차

④ 샘플링 편향 - sampling bias: 훈련 set와 테스트 set이 골고루 섞이지 않아, sample 데이터가 한쪽으로 치우침 →  데이터의 대표성이 없음  

 

 

3. 사이킷런은 입력 데이터(배열)가 어떻게 구성되어 있을 것으로 기대하나요?

① 행: 특성, 열: 샘플 

② 행: 샘플, 열: 특성

❌③ 행: 특성, 열: 타깃

❌④ 행: 타깃, 열: 특성

사이킷런은 numpy와 같이 행에 샘플, 열에 특성이 있다고 기대함. 

Comments