Post

[데이터 독학] 일단 기초 부터 틈틈히

소개

그냥 모르겠어가지고 구글에서 해주는 머신러닝 과정을 빠르게 대충 보고 넘어가기로 결심 구글기초머신러닝페이지

  • 머신러닝 Machine Learining
    • 기계학습, ml은 모델(소프트웨어)을 학습시켜 예측하거나 콘텐츠(텍스트, 오디오, 이미지, …)를 생성하는 과정
    • ml접근 방식을 통해 데이터 패턴간의 수학적 관계 학습할때 까지 ml모델에 엄청난 데이터 제공하여 원하는 것을 만들 수 있음
    • 모델: ml시스템이 예측하는데 사용하는 데이터에서 파생된 수학적 관계
  • ML 시스템 유형 ( 지도학습, 비지도 학습, 강화 학습, 생성형 AI) - 예측하거나 콘텐츠 생성하는 걸 학습하는 방식에 따라 이 카테고리 중 하나 이상에 속함.
    • 지도학습 : 정답이 있는 데이터를 확인하고 정답을 생성하는 데이터의 요소 간 연결을 발견하여 예측. 시험지와 답을 보고 공부하는 학생!
      • 회귀: 회귀 모델은 숫자 값 예측
      • 분류: 분류 모델은 카테고리 속할 가능성 예측. 출력이 숫자인 회귀와 다르게 특정 카테고리에 속하는지 여부를 나타내는 값 출력.
        • 이진분류: 값이 2개만 포함된 클래스에서 값을 출력, (예) 스팸 , 스팸아님
        • 다중클래스분류: 두개 이상의 값을 포함하는 클래스의 값 출력 (예) 비, 가랑비, 눈
    • 비지도학습 : 해당 모델은 답 없는 데이터 제공받아 예측. 데이터 간 의미있는 패턴을 식별. 모델에는 각 데이터 분류 방법에 관한 힌트가 없이 자체 규칙을 추론.
      • 클러스터링 기법: 분류와 다르게 카테고리가 사용자에 의해 정의되지 않고, 클러스터링 후 데이터 세트에 대한 이해를 바탕으로 클러스터의 이름을 지정할 수 있음.
    • 강화학습: 수행된 작업을 기반으로 보상 또는 불이익을 받아 예측. 가장 많은 보상을 얻기 위한 최적의 전략을 정의하는 정책 생성 (ex) 로봇방돌아다니기, 알파고
    • 생성형 AI : 사용자 입력에서 콘텐츠 생성 모델 클래스. 고유한 이미지 텍스트 이런거 만든다.
This post is licensed under CC BY 4.0 by the author.