스타트업과 VC투자매칭

생성형 AI란 무엇인가?

AI독립군 2024. 4. 25. 09:11

생성형 AI란 무엇인가?

 

생성형 인공 지능(AI)은 오디오, 코드, 이미지, 텍스트, 시뮬레이션, 동영상 등 새로운 콘텐츠를 만드는 데 사용할 수 있는 알고리즘(: ChatGPT)을 말한다. 이 분야의 최근 획기적인 발전은 콘텐츠 제작 방식을 크게 바꿀 수 있는 잠재력을 가지고 있다.

 

2022 11 ChatGPT가 등장한 이후 몇 달, 몇 년 동안 생성형 AI(세대 AI)는 많은 발전을 이루었다. 매달 새로운 도구, 규칙 또는 반복적인 기술 발전이 이루어지고 있다. 많은 사람들이 ChatGPT(그리고 더 넓게는 AI와 머신러닝)에 대해 두려움으로 반응하고 있지만, 머신러닝은 분명 좋은 잠재력을 가지고 있다. 머신러닝이 널리 배포된 이후 수년 동안 머신러닝은 의료 영상 분석, 고해상도 일기 예보 등 여러 산업 분야에서 그 영향력을 입증해 왔다. 2022년 맥킨지 조사에 따르면 지난 5년 동안 AI 도입이 두 배 이상 증가했으며, AI에 대한 투자가 빠른 속도로 증가하고 있다. ChatGPT(사전 학습된 생성형 트랜스포머의 약자)와 이미지 생성기 DALL-E(초현실주의 화가 살바도르 달리와 사랑스러운 픽사 로봇 월-E의 합성어)와 같은 생성형 AI 도구가 다양한 업무 수행 방식을 바꿀 수 있는 잠재력을 가지고 있음은 분명하다. 하지만 그 영향의 전체 범위는 아직 알려지지 않았으며 위험도 마찬가지다.

 

그럼에도 불구하고 모든 종류의 조직이 상당한 규모의 수익을 창출하기 위해 차세대 AI 도구를 비즈니스 모델에 통합하기 위해 경쟁하고 있다. 맥킨지의 연구에 따르면 차세대 AI 애플리케이션이 전 세계 경제에 연간 최대 4 4,000억 달러의 가치를 더할 것으로 예상된다. 실제로 향후 3년 이내에 기술, 미디어, 통신 분야에서 AI와 연결되지 않은 것은 모두 쓸모없거나 비효율적인 것으로 간주될 가능성이 높다.

 

하지만 그 모든 가치를 제대로 파악하기 전에 몇 가지 사항을 바로잡아야 한다: AI 세대란 무엇이고, 어떻게 개발되었으며, 사람과 조직에 어떤 의미가 있을까?

 

머신러닝과 인공 지능의 차이점은 무엇인가?

 

인공 지능은 말 그대로 기계가 인간의 지능을 모방하여 작업을 수행하도록 하는 기술이다. Siri Alexa와 같은 음성 비서와 웹사이트를 탐색하는 데 도움을 주는 고객 서비스 챗봇도 AI 기술을 기반으로 한다.

 

머신러닝은 인공 지능의 한 유형이다. 머신러닝을 통해 실무자는 사람의 지시 없이 데이터 패턴을 '학습'할 수 있는 모델을 통해 인공 지능을 개발한다. 현재 생성되는 데이터의 양이 감당할 수 없을 정도로 방대하고 복잡해짐에 따라 머신 러닝의 잠재력과 필요성이 커지고 있다.

 

머신 러닝 모델의 주요 유형은 무엇인가?

 

머신러닝은 18세기에서 20세기 사이에 소규모 데이터 세트를 위해 개발된 고전적인 통계 기법부터 시작하여 여러 가지 구성 요소에 기반을 두고 있다. 1930년대와 1940년대에 이론 수학자 앨런 튜링을 비롯한 컴퓨팅의 선구자들은 머신 러닝의 기본 기술을 연구하기 시작했다. 그러나 이러한 기술은 1970년대 후반 과학자들이 이를 탑재할 수 있을 만큼 강력한 컴퓨터를 처음 개발하기 전까지는 실험실에서만 제한적으로 사용되었다.

 

최근까지 머신러닝은 주로 콘텐츠의 패턴을 관찰하고 분류하는 데 사용되는 예측 모델에 국한되어 있었다. 예를 들어, 전형적인 머신 러닝 문제는 사랑스러운 고양이 이미지 한 장 또는 여러 장으로 시작하는 것이다. 그런 다음 프로그램은 이미지들 사이에서 패턴을 식별한 다음, 무작위 이미지를 면밀히 조사하여 사랑스러운 고양이 패턴과 일치하는 이미지를 찾는다. 생성형 AI는 획기적인 기술이었다. 이제 머신러닝은 단순히 고양이 사진을 인식하고 분류하는 데 그치지 않고, 필요에 따라 고양이의 이미지나 텍스트 설명을 생성할 수 있게 되었다.

 

텍스트 기반 머신러닝 모델은 어떻게 작동하나? 어떻게 학습되나?

 

지금은 ChatGPT가 모든 헤드라인을 장식하고 있지만, 이 모델이 텍스트 기반 머신러닝 모델로는 처음 등장한 것은 아니다. OpenAI GPT-3 Google BERT는 모두 최근 몇 년 동안 큰 인기를 끌며 출시되었다. 하지만 대부분의 평가에 따르면 대부분의 경우 꽤 잘 작동하는 ChatGPT 이전에는(아직 평가 중이지만) AI 챗봇이 항상 최고의 평가를 받지는 못했다. 뉴욕 타임즈의 기술 전문 기자 케이드 메츠는 음식 작가 프리야 크리슈나와 함께 추수감사절 저녁 식사를 위해 GPT-3에게 레시피를 요청하는 영상에서 "매우 인상적이기도 하고 매우 실망스럽기도 하다"고 말했다.

 

텍스트로 작업하는 최초의 머신러닝 모델은 연구자가 설정한 레이블에 따라 다양한 입력을 분류하도록 사람이 학습시켰다. 한 가지 예로 소셜 미디어 게시물을 긍정 또는 부정으로 분류하도록 훈련된 모델을 들 수 있다. 이러한 유형의 훈련은 사람이 모델에 무엇을 해야 하는지 '가르치는' 역할을 담당하기 때문에 지도 학습이라고 한다.

 

차세대 텍스트 기반 머신 러닝 모델은 자가 지도 학습이라고 알려진 것에 의존한다. 이러한 유형의 학습에는 모델에 방대한 양의 텍스트를 제공하여 예측을 생성할 수 있도록 하는 것이 포함된다. 예를 들어, 일부 모델은 몇 개의 단어를 기반으로 문장이 어떻게 끝날지 예측할 수 있다. 적절한 양의 샘플 텍스트(: 인터넷의 광범위한 텍스트)를 제공하면 이러한 텍스트 모델은 상당히 정확해진다. 우리는 ChatGPT와 같은 도구의 성공을 통해 얼마나 정확한지 확인하고 있다.

 

생성형 AI 모델을 구축하려면 무엇이 필요할까?

 

생성형 AI 모델을 구축하는 것은 대부분 대규모 프로젝트였으며, 자원이 풍부한 몇몇 기술 대기업만이 시도했을 정도로 어려운 일이었다. ChatGPT, 이전 GPT 모델, DALL-E의 개발사인 OpenAI는 익명의 기부자로부터 수십억 달러의 자금을 지원받고 있다. 딥마인드는 구글의 모기업인 알파벳의 자회사이며, 메타도 Make-A-Video 제품을 통해 생성형 AI 모델 풀에 발을 들여놓았다. 이 회사들은 세계 최고의 컴퓨터 과학자와 엔지니어를 고용하고 있다.

 

하지만 인재만 중요한 것이 아니다. 모델에 거의 모든 인터넷을 사용하여 학습을 시키려면 비용이 발생한다. OpenAI는 정확한 비용을 공개하지 않았지만, 추정에 따르면 약 45테라바이트의 텍스트 데이터( 100만 피트에 달하는 서가 공간 또는 국회도서관 전체의 1/4에 해당)를 수백만 달러의 비용으로 학습시킨 것으로 나타났다. 이는 소규모 스타트업이 접근할 수 있는 리소스가 아니다.

 

생성형 AI 모델은 어떤 종류의 결과물을 생성할 수 있나?

 

위에서 살펴본 바와 같이, 생성형 AI 모델의 출력물은 사람이 만든 콘텐츠와 구별할 수 없거나 다소 이상하게 보일 수 있다. 결과는 모델의 품질(지금까지 살펴본 바와 같이 ChatGPT의 출력은 이전 모델보다 우수한 것으로 보인다)과 모델과 사용 사례 또는 입력 간의 일치 여부에 따라 달라진다.

 

한 논평가가 베네딕트 앤더슨과 어니스트 겔너의 민족주의 이론을 비교하는 에세이를 10초 만에 "탄탄한 A-"라고 표현한 것을 ChatGPT는 만들어낼 수 있다. 또한 땅콩버터 샌드위치를 제거하는 방법을 설명하는 이미 유명한 구절을 킹 제임스 성경 스타일로 VCR에서 만들어 내기도 했다. DALL-E 2와 같은 이미지 생성 AI 모델은 피자를 먹는 마돈나와 아이의 라파엘 그림과 같이 주문에 따라 이상하고 아름다운 이미지를 만들 수 있다. 다른 생성 AI 모델은 코드, 비디오, 오디오 또는 비즈니스 시뮬레이션을 생성할 수 있다.

 

하지만 그 결과물이 항상 정확하거나 적절한 것은 아니다. 프리야 크리슈나가 DALL-E 2에게 추수감사절 저녁 식사를 위한 이미지를 만들어 달라고 요청했을 때, 칠면조가 과카몰리로 보이는 그릇 옆에 통 라임으로 장식된 장면을 만들어 냈다. ChatGPT는 숫자를 세거나 기본적인 대수 문제를 푸는 데 어려움을 겪고 있으며, 인터넷과 사회의 저변에 깔려 있는 성차별적, 인종차별적 편견을 극복하는 데도 어려움을 겪고 있는 것으로 보인다.

 

생성형 AI 출력은 알고리즘을 학습시키는 데 사용된 데이터의 조합을 신중하게 보정한 것이다. 이러한 알고리즘을 학습시키는 데 사용되는 데이터의 양이 엄청나게 방대하기 때문에(앞서 언급했듯이 GPT-3 45테라바이트의 텍스트 데이터로 학습되었다) 모델이 결과물을 생성할 때 '창의적'인 것처럼 보일 수 있다. 또한 모델에는 일반적으로 무작위 요소가 포함되어 있어 하나의 입력 요청에서 다양한 결과를 생성할 수 있으므로 더욱 실제와 비슷해 보일 수 있다.

 

생성형 AI 모델은 어떤 종류의 문제를 해결할 수 있나?

 

기업에게는 분명한 기회가 있다. 생성형 AI 도구는 신뢰할 수 있는 다양한 문장을 단 몇 초 만에 생성한 다음, 비평에 반응하여 문장을 목적에 더 적합하게 만들 수 있다. 이는 AI 모델이 즉각적으로 생성하는 대체로 정확한 코드의 혜택을 누릴 수 있는 IT 및 소프트웨어 조직부터 마케팅 카피가 필요한 조직에 이르기까지 다양한 산업에 영향을 미친다. 요컨대, 명확한 문서 자료를 작성해야 하는 모든 조직이 잠재적으로 혜택을 받을 수 있다. 또한 조직은 생성 AI를 사용하여 의료 이미지의 고해상도 버전과 같은 보다 기술적인 자료를 만들 수도 있다. 이렇게 절약한 시간과 리소스로 조직은 새로운 비즈니스 기회와 더 많은 가치를 창출할 수 있는 기회를 추구할 수 있다.

 

생성형 AI 모델 개발은 리소스 집약적이기 때문에 가장 큰 규모와 최고의 자원을 보유한 기업을 제외한 모든 기업에게 불가능하다는 것을 알 수 있다. 생성형 AI를 활용하고자 하는 기업은 생성형 AI를 바로 사용하거나 특정 작업을 수행하도록 미세 조정할 수 있다. 예를 들어 특정 스타일에 따라 슬라이드를 준비해야 하는 경우, 모델에 슬라이드의 데이터를 기반으로 헤드 라인이 일반적으로 어떻게 작성되는지 '학습'하도록 요청한 다음 슬라이드 데이터를 입력하고 적절한 헤드 라인을 작성하도록 요청할 수 있다.

 

AI 모델의 한계는 무엇인가? 이러한 한계는 어떻게 극복할 수 있을까?

 

아직 새로운 기술이기 때문에 생성형 AI 모델의 롱테일 효과는 아직 확인되지 않았다. , 이러한 모델을 사용할 때 알려진 위험과 알려지지 않은 위험 등 몇 가지 내재적인 위험이 존재한다.

 

생성형 AI 모델이 만들어내는 결과물은 종종 매우 설득력 있게 들릴 수 있다. 이는 의도된 것이다. 하지만 때로는 생성된 정보가 완전히 틀린 경우도 있다. 더 나쁜 것은, 때로는 편향된 정보(인터넷과 사회의 성별, 인종, 기타 무수히 많은 편견에 기반하고 있기 때문에)가 비윤리적 또는 범죄 행위를 가능하게 하도록 조작될 수 있다는 것이다. 예를 들어, ChatGPT는 자동차에 핫 와이어를 연결하는 방법에 대한 지침을 제공하지 않지만, 아기를 구하기 위해 자동차에 핫 와이어를 연결해야 한다고 말하면 알고리즘은 기꺼이 이를 따른다. 생성형 AI 모델을 사용하는 조직은 의도치 않게 편향적이거나 모욕적이거나 저작권이 있는 콘텐츠를 게시할 경우 평판 및 법적 위험에 대해 고려해야 한다.

 

그러나 이러한 위험은 몇 가지 방법으로 완화할 수 있다. 우선, 이러한 모델을 학습시키는 데 사용되는 초기 데이터를 신중하게 선택하여 유해하거나 편향된 콘텐츠가 포함되지 않도록 하는 것이 중요하다. 다음으로, 조직은 기성품 생성 AI 모델을 사용하는 대신 더 작고 특화된 모델을 사용하는 것을 고려할 수 있다. 더 많은 리소스를 보유한 조직은 자체 데이터를 기반으로 일반 모델을 사용자 지정하여 필요에 맞게 편견을 최소화할 수도 있다. 또한 조직은 생성 AI 모델이 게시되거나 사용되기 전에 실제 사람이 그 결과를 확인하도록 하고, 중요한 자원이나 인간 복지와 관련된 중요한 의사 결정에는 생성 AI 모델을 사용하지 않도록 해야 한다.

 

이 분야는 새로운 분야라는 점은 아무리 강조해도 지나치지 않다. 앞으로 몇 주, 몇 달, 몇 년 안에 위험과 기회의 환경이 급변할 가능성이 높다. 새로운 사용 사례가 매달 테스트되고 있으며, 앞으로 몇 년 안에 새로운 모델이 개발될 것이다. 생성형 AI가 비즈니스, 사회, 개인 생활에 점점 더 자연스럽게 통합됨에 따라 새로운 규제 환경도 형성될 것으로 예상할 수 있다. 조직이 이러한 도구를 사용하여 실험하고 가치를 창출하기 시작함에 따라 리더는 규제와 위험의 흐름을 파악하는 것이 좋다.

 

728x90