본문 바로가기

AI/ASSOCIATE

ASSOCIATE 1.

 학습목표

 

1. AI 를 어디에 사용하고 활용하는지에 대해 이해하기

2. AI 개념과 AI 학습 원리를 배우고 이해하기

3. AI 모델 구성 요소와 AI 모델링 순서에 대해 이해하기


 

[1] AI 활용

 

AI 화가

  • 이미지 분류, 이미지 분석

 

AI 작문

  • AI 는 아직 자연어 처리와 의사 분야는 아직 사람보다는 미흡한 수준

 

AI 작곡

 

 

실시간 개체 검출

  • 이미지나 영상속의 개체를 탐지하여 개체의 카테고리를 분류

 

자율주행 차량

  • 100% 의존할 순 없지만, 향후 기대해볼 만함

 

컨텐츠 추천

  • AI 알고리즘을 통해 컨텐츠를 추천


[2] AI 개념

 

- AI 란?

스스로 생각하고 판단할 수 있는 컴퓨터

 

- AI 에게 내 일을 빼앗길 수 있다는 것이 사실인가?

모든 일이 AI 로 대체되지는 않는다. 그러나 AI 떄문에 없어 지는 일도 분면 존재하지만, AI 떄문에 새로 생겨나는 일 또한 존재한다

 

- AI 를 활용할 때 중요한 점은?

문제의 본질을 파악하는 능력이 필요

데이터를 만드는 능력이 필요

AI = 자동화 + 지능화

문제를 파악한 후 데이터 를 확보하여 AI 를 학습과정이 필요


 

[3] AI 모델 구성 요소

 

인공지능 = 인간의 지적능력(추론, 인지)을 구현하는 모든 기술

머신러닝 = 알고리즘으로 데이터를 분석, 학습하여 판단이나 예측하는 기술

  • 선형회귀
  • 로지스틱 회귀
  • K-최근접 이웃
  • 결정트리
  • 랜덤포레스트
  • 서포트 벡터 머신

딥러닝 = 인공신경망 알고리즘을 활용하는 머신러닝 기술

  • 심층신경망(DNN: Deep Neural Network)
  • 합성곱신경망(CNN: Convolutoin Neural Network)
  • 순환신경망(RNN: Recurrent Neural Network)
  • 강화학습

 

[4] AI 학습 원리

 

1. 관련 데이터 학습하기

2. 학습된 데이터 특징 파악하고 규칙 만들기

3. 규칙에 근거하여 판단하기

4. 정답예측값이 일치하도록 목표하기

5. 모델의 비용함수 구하기

6. 비용함수 최소화하기 및 최적화 알고리즘 이용하기

 

머신러닝

  • 지도학습 - 정답지로 학습, 분류/예측 (이미 주어진 주제를 통해 학습)
  • 비지도학습 - 정답없이 학습, 군집/특성 도출 (정답이 없으며, 분류가 쉽진 않음, 주로 차원 축소, 군집화, 이상치 채우이 등에 사용)
  • 강화학습 - 시뮬레이션 반복 학습, 성능 강화등에 사용 (에이전트가 보상/처벌 이란 매커니즘을 통해 보상을 많이 받겠끔 학습을 하는 것으로, 아직은 실환경에 적용하긴 어려우나 앞으로의 전망이 좋을것으로 보고 있음)

AI 모델 목표

 

모델에 입력값을 넣었을 때, 출력값(예측값)최대한 정답과 일치하게 하는 것

 

비용함수(Cost Function

  • AI 모델 목표를 추구하기 위해 필요한 개념
  • 출력값(예측값)과 정답과의 차이를 Cost, Loss, Error 라고 함
  • Y^(예측값) - Y(정답) = Cost, Loss, Error

최적화 알고리즘(Optimizer)

  • Cost Function 에서 나온 Cost 를 최소로 줄이기 위해 모델의 파라미터 (w, b)를 업데이트하면서 최적 모델 생성

[5] AI 모델 구성요소

 

데이터 / 모델링 으로 구성

 

개발 라이브러리 : Pandas, Numpy

개발 언어 : Python, Java

개발 환경(IDE) : Anaconda, VScode

HW : CPU, GPU, Memory, Disk

 

파이썬 개발 IDE

 

PyCharm, Anaconda , VScode, google Colab

Atom, Jupyter, Spyder, IDLE

 

파이썬의 장점

 

  • Python the Best Programming language in AI ( AI 분야 최고의 프로그래밍 언어인 파이썬)
  • Community support (커뮤니티 지원: 기존의 모델들을 참고하여 시간 단축)
  • Good visualization options (좋은 시각화 옵션)
  • Easy Coding (타 언어보다 배움의 장벽이 낮음)
  • Easy Readability (언어가 쉬운만큼 쉬운 가독성)
  • Platform independence (플랫폼 독립성)
  • Flaxibility (유연성)
  • Arich Python Libraries for AI Projects (AI 프로젝트를 위한 Arich Python 라이브러리)

파이썬 주요 패키지

Numpy : 행렬과 다차원 배열을 쉽게 처리할 수 있게 해주는 패키지

Pandas : 데이터를 처리하고 분석하는 데 효과적인 패키지

Matplotlib : 데이터를 차트나 플롯(plot)으로 그려주는 시각화 라이브러리 패키지

Seaborn : Matplotlib 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지

Scikits learn : 교육 및 실무를 위한 머신러닝 라이브러리 패키지

TensorFlow : 구글에서 만든 오픈소스 딥러닝 라이브러리 패키지



[5] AI 모델링 순서

 

 

데이터 정리시 학습 데이터와 평가 데이터로 나눈 후 학습 데이터로 모델을 학습 시킨 후 평가 데이터로 성능을 테스트

모델 테스트에서 적절한 값이 나오지 않는다면 모델을 다시 학습하는 식으로 모델 배포 전까지 해당 과정을 여러번 거친다.

'AI > ASSOCIATE' 카테고리의 다른 글

ASSOCIATE 5.  (2) 2025.07.03
ASSOCIATE 4.  (1) 2025.07.02
ASSOCIATE 3.  (0) 2025.04.18
ASSOCIATE 2.  (0) 2025.04.18