LLM에 대한 오해
페이지 정보
본문
LLM은 굉장히 유용한 도구입니다. ChatGPT를 시작으로 Claude, Gemini등의 서비스가 나와있고, 많은 사람들이 사용하고 있습니다.
저도 LLM과 관련한 몇 가지 소프트웨어를 개발했었기 때문에 충분히 AI의 발전에 대해서는 공감하고 있지만 그렇다고 해서 이 기술이 인간을 대체할 만한 것이라고는 보지 않습니다.
기술에 대해 폄훼하는 것은 아닙니다. 그냥 딱 현재의 기술만 놓고 냉정하게 봤을 때 인간과 유사한 AGI까지 나오려면 아직 한참 멀었다는 생각입니다.
채팅으로 AI와 이야기를 나눌 수 있다는 면에서 보면 영화에서나 나오던 자아가 있는 인공지능 처럼 느껴질 수 있습니다.
특히나 몇몇 제품은 더욱 그런 쪽으로 보이도록 만들어진 성향도 있습니다.
하지만 실제로 들여다보면 그냥 텍스트 확률 생성기 그 이상도 그 이하도 아닙니다. 현재 시점에서 AGI를 논하는 것도 택도 없는 이야기입니다.
왜 그런지 아주 간단하게 살펴보겠습니다.
아시다시피 LLM은 대규모의 텍스트를 학습시킨 모델입니다.
"아이고! 하늘이 참 [ ]"
이런 문장이 주어졌을 때 [ ]에 들어갈 말을 생성하는 것이 LLM의 역할입니다.
1. 맑구나(44%)
2. 푸르다.(40%)
3. 어두워.(10%)
4. 요상타.(5%)
5. 삐용삐용(1%)
LLM은 위와 같이 뭐가 가장 어울릴지 확률에 기반한 단어들을 만들고, 선택도 확률에 의해서 결정됩니다.
가장 높은 확률인 1번이 선택될 가능성이 높겠지만 낮은 확률로 5번이 채택될 수도 있습니다. 그래서 AI는 같은 질문에도 매번 답변이 다를 수 있습니다.
문제는 그다음 단어도 앞의 단어들에 의해서 결정되기 때문에 1번이 선택되었을 때의 문장과 5번이 선택되었을 때의 문장은 전혀 다르게 전개될 수 있고 이것은 거의 운이라는 것입니다.
자아가 있는 사람이라면 이렇게 랜덤하게 말을 할까요? 어감의 차이만 있을 뿐 자신의 의도를 정확하게 전달하겠지요.
그럼 채팅은 어떻게 하는 걸까요?
인간: 안녕? 너 이름이 뭐니?
AI: 내 이름은 X입니다. 당신의 이름은 무엇인가요?
요렇게 진행했고, 다시 대화를 이어간다고 가정합시다.
인간: 내 이름은 A다.
이때 AI에게 전달하는 데이터는 무엇일까요?
"내 이름은 A다."를 LLM에게 입력해서 응답을 받는 걸까요?
아닙니다.
인간: 안녕? 너 이름이 뭐니?
AI: 내 이름은 X입니다. 당신의 이름은 무엇인가요?
인간: 내 이름은 A다.
AI: [ ]
이렇게 지금까지 나눈 대화 내용을 모두 전달해야 합니다. 그래야 전체 맥락을 파악해서 마지막 [ ]에 들어갈 문장을 생성할 수 있는 것입니다.
하나의 채팅 세션에서 대화의 내용이 길어질 수록 이상한 내용이 나올 수 있는 것은 이런 이유 때문입니다. 지금까지 나눈 내용을 계속 해서 분석해 마지막 AI의 대사를 생성해야되기 때문이지요.
누군가에게 말을 걸때마다 지금까지 우리가 나눈 대화를 모두 전달해야 한다고 생각해봅시다. 이게 대화인가요?
AI는 대화를 기억하는 것도 아닙니다.
아니 정확히 말하면 AI와의 채팅이 아닙니다.
LLM은 그냥 텍스트를 분석해서 적절한 마지막 대사를 생성하는 겁니다.
하지만 ChatGPT 등의 서비스들은 이 사실을 교묘하게 감추고 잘 꾸며서 AI와 대화를 하는 것처럼 보이게 하고 있습니다.
내가 친 대사와 확률에 의해서 적절하게 생성된 텍스트는 앞으로 계속 생성될 텍스트에 영향을 미칩니다.
이런 사실을 알고 LLM을 사용한다면 범인공지능(AGI)은 물론이고 초인공지능도 아직 먼 이야기구나 하고 판단할 수 있을 것입니다.
저도 LLM과 관련한 몇 가지 소프트웨어를 개발했었기 때문에 충분히 AI의 발전에 대해서는 공감하고 있지만 그렇다고 해서 이 기술이 인간을 대체할 만한 것이라고는 보지 않습니다.
기술에 대해 폄훼하는 것은 아닙니다. 그냥 딱 현재의 기술만 놓고 냉정하게 봤을 때 인간과 유사한 AGI까지 나오려면 아직 한참 멀었다는 생각입니다.
채팅으로 AI와 이야기를 나눌 수 있다는 면에서 보면 영화에서나 나오던 자아가 있는 인공지능 처럼 느껴질 수 있습니다.
특히나 몇몇 제품은 더욱 그런 쪽으로 보이도록 만들어진 성향도 있습니다.
하지만 실제로 들여다보면 그냥 텍스트 확률 생성기 그 이상도 그 이하도 아닙니다. 현재 시점에서 AGI를 논하는 것도 택도 없는 이야기입니다.
왜 그런지 아주 간단하게 살펴보겠습니다.
아시다시피 LLM은 대규모의 텍스트를 학습시킨 모델입니다.
"아이고! 하늘이 참 [ ]"
이런 문장이 주어졌을 때 [ ]에 들어갈 말을 생성하는 것이 LLM의 역할입니다.
1. 맑구나(44%)
2. 푸르다.(40%)
3. 어두워.(10%)
4. 요상타.(5%)
5. 삐용삐용(1%)
LLM은 위와 같이 뭐가 가장 어울릴지 확률에 기반한 단어들을 만들고, 선택도 확률에 의해서 결정됩니다.
가장 높은 확률인 1번이 선택될 가능성이 높겠지만 낮은 확률로 5번이 채택될 수도 있습니다. 그래서 AI는 같은 질문에도 매번 답변이 다를 수 있습니다.
문제는 그다음 단어도 앞의 단어들에 의해서 결정되기 때문에 1번이 선택되었을 때의 문장과 5번이 선택되었을 때의 문장은 전혀 다르게 전개될 수 있고 이것은 거의 운이라는 것입니다.
자아가 있는 사람이라면 이렇게 랜덤하게 말을 할까요? 어감의 차이만 있을 뿐 자신의 의도를 정확하게 전달하겠지요.
그럼 채팅은 어떻게 하는 걸까요?
인간: 안녕? 너 이름이 뭐니?
AI: 내 이름은 X입니다. 당신의 이름은 무엇인가요?
요렇게 진행했고, 다시 대화를 이어간다고 가정합시다.
인간: 내 이름은 A다.
이때 AI에게 전달하는 데이터는 무엇일까요?
"내 이름은 A다."를 LLM에게 입력해서 응답을 받는 걸까요?
아닙니다.
인간: 안녕? 너 이름이 뭐니?
AI: 내 이름은 X입니다. 당신의 이름은 무엇인가요?
인간: 내 이름은 A다.
AI: [ ]
이렇게 지금까지 나눈 대화 내용을 모두 전달해야 합니다. 그래야 전체 맥락을 파악해서 마지막 [ ]에 들어갈 문장을 생성할 수 있는 것입니다.
하나의 채팅 세션에서 대화의 내용이 길어질 수록 이상한 내용이 나올 수 있는 것은 이런 이유 때문입니다. 지금까지 나눈 내용을 계속 해서 분석해 마지막 AI의 대사를 생성해야되기 때문이지요.
누군가에게 말을 걸때마다 지금까지 우리가 나눈 대화를 모두 전달해야 한다고 생각해봅시다. 이게 대화인가요?
AI는 대화를 기억하는 것도 아닙니다.
아니 정확히 말하면 AI와의 채팅이 아닙니다.
LLM은 그냥 텍스트를 분석해서 적절한 마지막 대사를 생성하는 겁니다.
하지만 ChatGPT 등의 서비스들은 이 사실을 교묘하게 감추고 잘 꾸며서 AI와 대화를 하는 것처럼 보이게 하고 있습니다.
내가 친 대사와 확률에 의해서 적절하게 생성된 텍스트는 앞으로 계속 생성될 텍스트에 영향을 미칩니다.
이런 사실을 알고 LLM을 사용한다면 범인공지능(AGI)은 물론이고 초인공지능도 아직 먼 이야기구나 하고 판단할 수 있을 것입니다.
추천71 비추천 25