[대학원 강의]20240309 산업 AI 강의 정리
카테고리: Collage
인공지능의 분류
AI는 크게 강 인공지능과 약 인공지능으로 나뉘게 됩니다.
약 인공지능
약 인공지능은 사진에서 물체를 찾거나 소리를 듣고 상황을 파악하는 것과 같이 기존에 인간은 쉽게 해결할 수 있으나, 컴퓨터로 처리하기에는 어려웠던 각종 문제를 컴퓨터로 수행하게 만드는데 중점을 두고 있습니다.
한참 막연한 인간 지능을 목표로 하기보다는 더 현실적으로 실용적인 목표를 가지고 개발되고 있는 인공지능이라고 할 수 있으며, 지능을 가진 무언가라기 보다는 특정한 문제를 해결하는
도구로서 활용 됩니다.
간단하게 말하자면, 각종문제를 컴퓨터가 수행하게 만드는 것입니다. 즉, 자동화를 하는 것입니다.
이정도의 기능은 개인의 개발자들도 만들어서 사용할 수 있습니다.
지금까지 만들어진 것들은 대부분 약 인공지능의 일종이라고 할 수 있습니다.
대표적으로 구글사의 알파고, 구글 어시스턴스 등등이 있습니다.
이외에 지금 사용하고 있는 모든 AI 툴은 거의 다 약 인공지능이라고 생각하시면 됩니다.

강 인공지능
약 인공지능에 대비되는 의미로 만들어진 용어 입니다. 약 인공지능은 어떤 특정한 한 가지 분야의 주어진 일을 인간의 지시에 따라 수행하는 인공지능을 말하는데 이러한 약인공지능의 제한된 기능을 뛰어넘어 더 발달된 인공지능이 바로 강 인공지능 입니다.
다시 말하자면, 약 인공지능은 사용자의 Input을 받아서 실행된다고 하면, 강 인공지능은 사용자의 Input 없이도 스스로 생각하고 행동하는 공상과학에서의 AI를 말하게 됩니다.
공상과학에서의 AI인 만큼 아직 개발된 것은 없습니다. 상상만 하는 겁니다.

AI 의 생명 및 산업구조
현재 2022년 10월, ChatGPT 가 등장하면서 AI 열풍이 불고 있습니다.
하지만 교수님은 현재 시점이 AI의 끝물이라고 표현하셨습니다. 또한, 다음 시퀀스가 와야 한다고 하셨습니다.
그것의 논리는 다음과 같습니다.
산업에서 가장 먼저 바뀌는 것은 통신망, 즉 하드웨어 부터 바뀌게 됩니다. 그다음 센서나 통신망이 깔리게 되면 그걸 사용하게 되는 새로운 대바이스가 나오게 됩니다.
그렇게 디바이스가 보급화 되고, 사용되면서 데이터가 쌓이게 됩니다. 그렇다면, 이제 쌓인 데이터를 어떻게 처리하냐를 생각하게 됩니다. 거기에 AI가 큰 발전을 이룰 수 있는 것이죠.
산업주기가 이런느낌으로 돌아간다고 합니다. 그래서 다음 통신망 즉, 하드웨어는 무엇이 될 것이냐? 라고 할때 교수님은 스타링크라고 답변하였습니다.
일론머스크가 제약없는 통신환경을 구축하기 위해 인공위성을 쏘아 올리는 그 사업입니다. 어떻게 될지 궁금하네요.
연합 학습(Federated Learning)
연합학습은 다수의 로컬클라이언트와 하나의 중앙 서버가 협력하여 데이터가 탈중앙화된 상황에서 글로벌 모델을 학습하는 기술입니다.
여기서 로컬 클라이언트는 사물인터넷 기기, 스마트폰 등을 말합니다.
이 기술이 최근 각광받고 있는 이유는 기존의 머신러닝 기법들과는 달리 데이터의 익명성이 보장된다라는 강점을 가지고 있습니다. 반대로 기존 머신러닝에서는 모바일 디바이스 또는 센서 등의 장치에서 얻은 정보를 하나의 중앙 서버로 취합하여 학습이 진행됩니다.
중앙서버로 가중치들만 전송이 됨으로써, 각각의 장치가 갖고 있는 로컬 데이터가 학습을 위해 중앙 서버로 전송되지 않아도 된다는 것입니다.
AutoML(Automated Machine Learning)
머신러닝 모델을 개발하고 실제 운영에 도입하기에는 수많은 과정을 거치게 됩니다.
모든걸 혼자할 수 있는 인공지능이 존재하여 컴퓨터와 데이터만 주어지면 모든 과정을 알아서 해결해 줄 수 있지만, 현실은 그렇지 않죠.
현실의 머신러닝 모델링은 문제 정의 과정에서부터 데이터 수집, 전처리, 모델 학습 및 평가를 거쳐 서비스 적용에 이르기까지 여러 분야의 전문가들의 시간과 노력을 투자하여 만들어 집니다.
AutoML은 머신러닝을 적용할 때 마다 이러한 과정을 되풀이하면서 발생하는 비효율적인 작업을 죄대한 자동화하여 생산성과 효율을 높이기 위해 등장하였습니다.

특히, 데이터 전처리 과정에서부터 알고리즘 선택 및 튜닝까지의 과정에서 모델 개발자의 개입을 최소화 하여 품질 좋은 모델을 효과적으로 개발할 수 있는 기술에 대한 연구가 오랜동안 진행되어 왔습니다.
즉, 머신러닝에 들어가는 비용과 시간을 줄이기 위한 노력이라고 생각하면 될 것 같습니다.
CNN (Convolutional neural network)
Convolutional Neural Networks란 딥러닝에서 주로 이미지나 영상 데이터를 처리할 때 쓰이며, Convolution이라는 전처리 작업이 들어가는 Neural Network 모델 입니다.

CNN 사용하는 이유
일반 DNN(Deep Neural Network)의 문제점은 기본적으로 1차원 형태의 데이터를 사용합니다. 때문에 2차원의 형태 이미지 입력값 (1028 * 1028)이 들어오면 이것을 flatten 시켜서 한줄 데이터로 만들어야 하는데 여기서 손실이 크게 발생하게 됩니다. 또한, 추상화 과정 없이 바로 연산해버려서 학습시간과 능률의 효율성이 저하됩니다.
이러한 문제점에서 부터 고안한 해결책이 CNN 입니다. CNN은 이미지를 날것 그대로 받아버려서 공간적/지역적 정보를 유지한 채 특성들의 계층을 빌드업 합니다.
CNN의 중요 포인트는 이미지 전체보다는 부분을 보는 것, 그리고 이미지의 한 픽셀과 주변 픽셀들의 연관성을 살리는 것입니다.
YOLO 모델 (You Only Look Once)
YOLO모델은 말 그대로 이미지를 한번만 보고 바로 물체를 검출하는 딥러닝 기술을 이용한 물체 검출 모델 입니다.

YOLO 이전에 등장한 딥러닝 모델들은 이미지를 여러번에 걸쳐서 확인하며 동작하였기 때문에 상대적으로 한장의 이미지를 처리하는데 많은 시간이 소요되었습니다. 따라서 실시간 물체 검출이 필요한 경우에는 해당 모델을 사용하기가 어려웠습니다.
하지만 YOLO 모델은 이미지를 한번만 슥 보고 바로 Object Detection을 수행하기 때문에 이미지에 대해 빠른 속도로 Obejct Detection을 수행할 수 있다는 장점이 있습니다. 이는 동영상처럼 계속 이미지가 나오는 곳에서 월등한 성능을 낼 수 있습니다.
반대로, 한장만 봤을 때는 YOLO 모델은 형편없는 성능을 내게 됩니다. 즉, 이 모델은 비지니스를 고려한 모델 입니다.
AI를 산업에서 적용시키기
Chat GPT는 휴먼 피드백방식을 도입하였습니다.
대답에 대한 좋아요 버튼을 누를 수 있도록 한 것입니다. 이렇게 하여 사용자가 많이 좋아요 한 답변을 학습하고, 서비스 품질을 높이는 방식입니다.
이 과정에 파인튜닝이 들어가게 됩니다.
이 이야기를 하는 것은, 산업에서으 AI는 사람이 느끼기에 정확도나 만족도가 얼마나 높은지가 관건 이라는 것입니다. 사용자가 그 서비스를 사용했을 때, 만족도를 느낄 수 있도록 트릭을 만들어야 합니다.
같은 맥락으로, AI를 만드는 것과 실제 산업에서 쓸 수 있는 것은 다른 문제입니다. 예를들어 인식률이 100%에 육박하는 모델을 만들어놨다고 생각해봅시다. 하지만 이것을 실제로 서비스에 접목시키니, 한개의 사진을 인식할 때, 1시간이 소요되었습니다.
이렇게되면, 이모델을 사람들이 사용하게 될까요? 아마 아닐겁니다. 성능이 낮더라도, 속도가 빠른 모델을 찾게 될 것 입니다.
즉, 산업 AI에서 가장 중요한 것은 AI의 성능과, 사용자의 만족감 사이에서 오묘한 지점을 찾는 것을 목표로 합니다.
댓글 남기기