챗 GPT 판사 시행되면 스마트폰도 필요 없어진다고?
반도체 회사에서 시뮬레이션 일을 하다가 현재는 <반도체 제국의 미래> , 라는 책의 작가로 다방면에서 활동하고 있는 정인성 작가님은 많은 사람들로부터 젊은 나이에 엄청난 실력과 지식을 인정받은 분인데요, 오늘은 그가 인공지능으로 돈을 벌고 싶다면 꼭 알아야 하는 것에 대해 자세히 설명해줄 텐데요, 그게 무엇일까요?
인공지능에 관해 사람들이 흔하게 하는 착각은 “인터넷에는 데이터가 무한하니까 데이터를 넣으면 똑똑해지겠지?”라고 생각하겠지만 그렇지 않습니다. 예를 들면 인공지능으로 개와 고양이를 구분 시켜야 한다고 가정 했을 때, 사진과 함께 개와 고양이를 써야 한다고 합니다. 이런 식의 질문과 정답 쌍이 공존해야 학습이 가능하다고 하죠. 이렇게 사진은 쉽지만 말을 하는 인공지능은 결코 쉽지 않다고 합니다.
질문과 대답이 쌍 자체를 찾는 것도 굉장히 어려울 뿐만 아니라 신뢰할 수 있는 말도 판단을 해서 정제를 하는 과정을 거쳐야 하기 때문에 수백억 단어가 넘는 질문과 대답의 쌍을 사람이 직접 할 수 없는 양이라고 합니다. 때문에 기존에 있는 데이터 중에 좋은 데이터를 정제해서 쓰는 것이 중요합니다. 그런데 GPT의 요약방식이라면 얘기가 달라지는데요, 기존 인공지능과 다른 점이 무엇일까요?
GPT가 요약을 잘하는 이유는 예를 들어 위키피디아 같은 곳에서 ‘introduction’이 사실상 요약이고 밑 내용이 본문인데, 본문을 주고 ‘이걸 요약해줘’라고 하고 정답을 ‘introduction’을 넣으면 요약이 잘 된다고 합니다. 여기서 중요한 건, 사람들이 GPT를 활용해서 세상을 바꾸려면 앞서 말한 식의 데이터가 있는 곳이어야 적용이 가능하다는 점이죠.
예를 들어 내가 법조계 쪽으로 GPT를 쓰고, 학습 시키고 싶다면, 방대한 양의 판례와 답이 필요할 뿐만 아니라, 그것들이 얼마나 좋은 판례인지도 다 고려해야 한다는 점 입니다.
그런데 여기서 더 나아가 ‘사업성’도 따져야 하는데요, 그런 GPT를 학습시켰으면 결국 세계 곳곳에서 쓰여야 할텐데 만약에 한국에서 법조계 쪽으로 학습을 시켰지만 해당 데이터가 해외에선 적용이 안되니 그런 문제들도 다 고려를 해야 한다는 것입니다.
법조계 관련한 사업이 아니더라도, 현재 공개된 챗GPT는 대략 3천 단어 정도만 입력으로 들어갈 수 있는데요, 챗 GPT랑 대화를 주고받을때 3천 단어가 넘어가면 위에 했던 대화들을 까먹는다고 합니다. 그런데 그걸 늘리기 위해서는 데이터도 많이 필요하고 사양도 훨씬 많이 먹게 되죠.
그래서 비즈니스를 위해서 3천 단어보다 더 용량이 높은 8만 단어가 필요한 경우 연산해야될 모든 것들이 4배 이상으로 커지기 때문에 새로운 반도체가 필요한 상황까지 마주하게 된다고 합니다.
이렇게 좋은 사업성과 아이템이 있어도 마음대로 할 수 없는 이유에 대해서 정인성 작가님의 의견을 들어보았는데요, 다양한 리스크와 경우의 수를 고려해 기술의 발전과 함께 커갈 수 있는 사업구상을 하는 것이 지금 상황에선 가장 필요한 단계라고 생각이 드는데요, 여러분은 어떻게 생각하시나요?
“본 원고는 유튜브 ‘머니인사이드’ 채널의 제휴를 받은 원고입니다.”