LG Aimers

[Module3] ML개론 PART1 Introduction to ML

메델 2024. 1. 11. 16:09

Part1. Introduction to ML

 

기계학습

  • 정의 
    • 인공 지능의 한 분야
    • 컴퓨터 알고리즘을 다루는데 수 많은 경험 혹은 경험으로부터 얻은 Data로부터  기계학습 알고리즘이 스스로 좋아지는 상황
    • 잘 정의된 인공지능 알고리즘이란 세가지가 완벽하게 정의되어 있어야함 
      • T : classification, regression, detection
      • P: error rate, accuracy, likelihood, margin
      • E: data
  • 목표
    • 알고리즘을 설계하는데 실험적으로 얻은 Data로부터 점점 개선되도록 할 수 있는 알고리즘 설계하고 개발하는 분야
    • 일반
  • 기계학습을 하는 이유 
    • Generalization
      • 특정 사례들의 공통적인 특징을 일반적인 개념이나 주장으로 추상화하는 형태
      • 많은 별개의 객체들로부터 유사성을 분하여 개념의 본질 추출
    • Training이 잘되게하는게 목표가 아니라 어떤 패턴을 배워서 Training Data에서 보지 못한 새로운 Data가 오더라도 잘 하기를 기대하는 것이 목표 
  • No Free Lunch Theorem
    • 매번 새로운 Task, 새로운 Data를 모을 때마다 최적의 알고리즘을 차즌 과정을 수행해야 한다.
    • 어떤 기계학습 알고리즘이 다른 기계학습 알고리즘보다 항상 좋다고 말할 수 없음 
  • 기계학습 종류 
    • Supervised Learning (지도학습)
    • Unsupervised Learning (비지도학습)
      • 너무 큰 기대를 하지말아야 함
      • Clustering, Anomaly Detection, Outlier, Density Estimation
    • Semi-supervised Learning  (준지도학습)
      • LU learning 
        • 몇몇의 Data들은 Label을 주고 그 이외의 Data들은 Label을 안 주는 경우 
      • PU learning
        • One-class Classification의 일종
        • 특정 Class에 대한 Data만 주어지고 나머지 Class에 대해서는 Data가 주어지지 않은 경우
    • Reinforcement Learning (강화학습)
      • Dataset이 사전에 주어지는 것이 아니라 대신 환경이 주어짐
      • Supervisor가 있는 게 아니라 환경이랑 interaction하면서 학습하는 과정
      • 다른 방법보다 시간이 오래 걸리며 난이도 훨씬 높음