[독후감]인공지능 비즈니스의 모든 것

3 minute read


최근 공기관에서 인공지능 기술이 적용된 웹서비스 운영 업무를 하고 있다. 사이트 운영을 하다보니 인공지능을 기술적으로 공부하기만 했던 때와는 다른 점이 중요해진다. 가령 공부할 때는 이 기술이 어떻게 작동하는 것인지 원리를 파악하고, 모델의 성능을 높이기 위해 하이퍼파라미터나 데이터를 변경하는 등 다양한 방법을 시도한다. 그리고 성능이 얼마나 이전보다 나아졌는지가 중요하다. 하지만 일반인을 위한 서비스를 운영하는 입장에서 인공지능 기술 자체보다 사용자가 경험하는 웹서비스와의 상호작용이 중요하다. 서비스적 측면에서 UX/UI가 훨씬 중요하다는 말이다.

단순하게 말하면 사용자 입장에서는 웹서비스에서 BERT를 쓰던, CPT를 쓰던 관심이 없다. 사용자는 자신이 원하는 서비스를 제공받고 만족하면 된다. 인공지능 기술은 이 과정에서 하나의 수단일 뿐이다. 물론 인공지능 기술을 고도로 개발해서 서비스하는 네이버나 카카오 같은 IT기업은 상황이 다를 수 있다. 하지만 더 많은 경우는 나처럼 인공지능 기술 자체가 상품이 아니라 추천같이 서비스의 일부 기능을 제공하는 경우가 더 많을 것이다. 인공지능을 활용한 사업의 최신 사례와 인공지능과 사업의 접목에 대한 통찰을 얻기 위해 본 책을 읽었다.

본 책을 읽으면서 특히 관심이 있었던 내용은 아래와 같다.

1. AI를 활용한 비지니스에서 중요한점(최우용 대표 대답)(p-171)

“저희가 한국에 있을 때는 기술에 집중해서 그 누구보다 기술을 더 잘하고 싶다고 생각했는데요. 여기 와서는 그 신념이 깨져버렸어요. 기술보다는 제품·시장 맞춥(Product Market Fit. 시장에서 필요로 하는 제품을 만들고 이를 증명하는 과정)이 중요하다는 사실을 알게 되었고, 특히 우리가 속해 있는 시장을 구체적으로 파악하는 것이 가장 중요하다는 것을 깨달았습니다. 그래서 한 달 동안 시장조사를 열심히 하고 치열하게 고민하면서 고객들과 계속 대화를 나누었지요.”

2. AI를 이용해 비즈니스를 할 때 고려사항(p-175)

  1. 학습할 때 중요하게 정의하는 손실함수(Loss Function)를 비즈니스의 목적에 맞게 조정해야 한다.
  2. AI의 판단 잘못으로 인해 발생할 수 있는 비용은 시점과 방식에 따라 크게 다르다.
  3. 가능하다면 최대한 AI모델을 설명할 수 있게 만들어야 한다.
  4. AI 모델의 크기가 커지면 일반적으로 더욱 정확하고, 신뢰도가 높아질 가능성이 크다. 하지만 비용이 증가와 답을 내는데 걸리는 시간도 그만큼 오래 걸린다.
  5. AI 모델의 크기, 성능, 비용에 대한 타협점을 적절하게 고려해야 한다.
  6. 학계와 달리 비즈니스 세계에서는 SOTA(state-of-the-art, 최신이자 최고의 성능)를 그다지 중요하게 보지 않는 경우가 많다.
  7. 데이터를 획득하고 레이블을 붙이는 것은 모두 비용이다.
  8. 연구할 때는 드물게 나타나는 문제들이 비즈니스에 적용할 때는 더 자주 나타나거나 생각보다 큰 문제를 일으키는 경우가 있다.
  9. 되도록 높은 수준의 좋은 설명이 붙은 데이터를 많이 확보해야 한다.

3. 데이터사이언티스트란?(김재연 박사님 대답)(P-225)

“학계에서는 연구를 할 경우, 본인이 데이터 수집하고 분석해서 발표합니다. 혼자 다하는 거죠. 가내수공업 아니면 중소기업 같은 모델입니다. 하지만 기업으로 넘어가면, 큰 조직에서 공동으로 일하기 때문에 분업이 잘 되어 있어여. 그래서 데이터 사이언티스트라고 하면, 한쪽에는 제품 만드는 사람들이 있고, 알고리듬을 짜고, 엔지니어링 하는 사람들이 있고, 다른 쪽에서는 그것 가지고 물건을 파고, 제품을 디자인하는 사람들이 있는데 데이터 사이언티스트는 그 사람들 중간에 있습니다. 데이터 사이언티스 중에는 어떤 경우에는 소프트웨어 엔지니어와 차이가 없기도 합니다. 데이터 사이언티스트로 일하다가 소프트웨어 엔지니어로 넘어가기도 합니다. 통계학에 기반을 두고 분석 분야로 넘어가는 사람도 있고요. 아니면 도메인 지식이라고 하는 사회과학 분야에 대한 지식을 바탕으로 조금 더 다양하게 데이터 사이언스와 관련된 문제를 해결하는 사람들이 있어요. 트랙이 여러 가지죠. 그리고 그 안에서 다양한 문제를 그때그때 주어지는 대로 푸는 데이터 사이언티스트가 있고, 특정분야만 하는 이들도 있어요. 인사 분야라면 인사쪽 데이터만 다루는 사람, 세일즈라면 세일즈 쪽 데이터, 제품이면 제품 쪽 데이터만 다루면서 해당 분야의 스페셜리스트가 되는 거죠.”

  • 참고로 나는 특정 도메인 지식을 갖고 데이터사이언스를 활용하는 스페셜리스트가 되고 싶다.

4. AI의 해석가능성(p-236)

해석가능성이 중요하다고 여겨지는 이유는 AI가 왜 이런 결정을 내렸는지 설명할 수 있어야 하기 때문이다. 특히 자율주행 자동차나 의료 행위와 같이 잘못된 판단의 결과 큰 위험을 초래하는 경우, 얼마나 안전한지 측정하고 테스트할 수 있어야 하므로 해석가능성이나 설명가능성의 중요도가 더욱 커진다.

  • 예) 은행 대출 부서에서 AI가 대출 여부를 판단

5. AI의 공정성(p-248)

프로세스를 통해 편견을 가진 데이터가 생성되고, 이것이 학습 데이터가 되면서 사회 전반에 편견을 증폭시킬 수 있다. 학습을 위해 데이터를 모으고 레이블을 붙이는 과정에서 인간의 편견이 가미되고, 모델이 학습할 때도 편견이 들어가며, 이 결과를 미디어가 인간의 편견에 맞춰 필터링하고 순위를 매기고 모으면 사람들이 그 결과를 보고 또다시 편견을 갖게 되고, 그 사람들이 다시 학습데이터를 만들 때 편견이 들어가는 식으로 계속 증폭된다면 큰 문제가 아닐 수 없다.

  • 현재 사회적으로 제기되고 있는 네이버나 다음 같은 포털의 뉴스 상위 노출 AI모델의 객관성에 대한 관점에서 다시 한번 생각해보게 된다.

6. 메타러닝(p-261)

학습하는 것을 학습하는 것으로, 여러 가지 작업을 하나 또는 매우 적은 수의 연습만으로 잘 해내는 것에 목적을 둔 접근이다. 기존에 타목적으로 학습된 모델을 유사한 다른 목적의 모델을 최소한의 학습을 통해 사용하는 것이다. 원샷 러닝, 제로샷 러닝이 이에 해당하는 기술이다. 고양이와 새를 구분하는 데이터 세트 1번과 꽃과 자전거를 구분하는 데이터 세트 2번을 학습시켜 두 가지를 모두 잘 구분하는 네트워크는 다른 두 가지(예를 들어 개와 수달을 구분)를 구분하는 것도 쉽게 해낸다는 접근이다.

7. 정리

인공지능과 비즈니스에 관한 다양한 정보와 유의점을 파악할 수 있었다. 무엇보다 인공지능 분야의 실무자, 사업가, 투자자와 인터뷰한 내용도 유용했다. 나와 같이 인공지능을 활용한 서비스를 사업화하고 싶은 사람이 읽으면 좋을 것 같다. 책을 읽으면서 저자가 인공지능에 대한 기술과 사업에 대한 많은 지식과 경험이 있다는 것을 느낄 수 있었다. 다만 내가 기대했던 현재 국내 및 해외에서 인공지능를 활용한 사업 현황이나 소개에 대한 부분은 많이 다루고 있지 않다는 점은 아쉽다.



Leave a comment