hosi_stella
[혼공학습단 8기] 1주차 본문
1주차
기본 미션: 코랩 실습 화면 캡쳐하기
데이터 편향 극복하기:
선택미션: Ch.02(02-1) 확인문제 풀고, 풀이 과정 정리하기
1. 머신러닝 알고리즘의 한 종류로서 샘플의 입력과 타깃(정답)을 알고 있을 때 사용할 수 있는 학습 방법은 무엇인가요?
⭕① 지도 학습 - input(data), target(정답)으로 모델 학습하는 알고리즘
❌② 비지도 학습 - 타깃 없이 입력데이터만 사용하는 알고리즘
❌③ 차원 축소 - 데이터의 의미를 제대로 표현하는 특징을 파악하여 중요한 특성만 선택하여 특성의 개수를 줄이는 방법
❌④ 강화 학습 - 알고리즘이 행동한 결과로 얻은 보상으로 학습하는 알고리즘
2. 훈련 세트와 테스트 세트가 잘못 만들어져 전체 데이터를 대표하지 못하는 현상을 무엇이라고 부르나요?
❌① 샘플링 오류
❌② 샘플링 실수
❌③ 샘플링 편차
⭕④ 샘플링 편향 - sampling bias: 훈련 set와 테스트 set이 골고루 섞이지 않아, sample 데이터가 한쪽으로 치우침 → 데이터의 대표성이 없음
3. 사이킷런은 입력 데이터(배열)가 어떻게 구성되어 있을 것으로 기대하나요?
❌① 행: 특성, 열: 샘플
⭕② 행: 샘플, 열: 특성
❌③ 행: 특성, 열: 타깃
❌④ 행: 타깃, 열: 특성
사이킷런은 numpy와 같이 행에 샘플, 열에 특성이 있다고 기대함.
'혼자공부하는 머신러닝+딥러닝' 카테고리의 다른 글
[혼공학습단8기] 혼공머신 6주차 (0) | 2022.08.20 |
---|---|
[혼공학습단 8기] 혼공머신 5주차 (0) | 2022.08.14 |
[혼공학습단] 4주차 (0) | 2022.07.28 |
[혼공학습단 8기] 3주차 (0) | 2022.07.24 |
[혼공학습단 8기] 2주차 (0) | 2022.07.17 |
Comments