빠와 까를 미치게 하는 GPT 5 분석

샘 알트먼이 "the AGI"라고 부르던 GPT-5 통합 모델이 출시되었습니다.

이번에 살짝 전략을 바꿨는데 이거 때문에 빠와 까를 미치게 하고 있습니다.

7억명의 유저들이 불타고 있는데 왜 그런지 좀 알아봤습니다.

1. 성능

일단 GPT5는 신기하게도 모델 여러개의 집합체라고 합니다.

라우터 기능이 들어있어서 질문주면 지가 알아서 적절한 모델을 선택해서 돌린다고 되어있습니다.

그리고 신기능 설명하는 부분 보시면 뭔가 사소한 것들인데 있어보이게 포장해놓은거 같아서

식당으로 치자면 "단무지 김치 무료제공 우와아" 이런 느낌이긴 합니다.

보통 새로운 모델이 나오면 다른 회사 모델들이랑 성능 비교하는 차트같은게 있을 법 한데 이상하게 없습니다.

그래서 직접 몇개 찾아봤습니다.

일단 수학성적은 상당히 높습니다. 그록이랑 클로드 신형 모델은 70~90점 입니다.

하지만 thinking 모드를 켜야 높은 성적을 내는걸 볼 수 있습니다.

예를 들면 AI들이 가장 어려워하는 9.11 빼기 9.9 계산하는거 물어보면 GPT5를 쌩으로 쓰면 0.1초만에 바로 답을 주긴 하는데 틀려버립니다.

Thinking모드를 켠 다음에 물어보면 열심히 수식을 세워서 결국 맞춰줍니다.

이번 모델은 할루시네이션이 확실히 덜 일어난다는 소리가 있고

그리고 의학 지식 벤치마크 성적이 확 높아졌습니다.

저도 최근에 여유증인가 가슴이 커져가지고 병원에 갔었는데 그냥 GPT한테 물어보고 치료받을걸 그랬습니다.

Agent 코딩 벤치마크 보시면 타사 모델들이랑 비슷한 성능을 보여주는 것 같습니다.

그래서 그런가 코딩 잘한다고 홍보하는 부분에서는 AI 기업들 CEO들을 불러와가지고 GPT5 생생후기 같은걸 보여주더라고요.

2. 코딩성능

그래서 직접 코딩시켜봤습니다.

이번 모델이 프론트엔드 부분을 진짜 잘해준다는데 심심해서 이런걸 만들어봤습니다.

이전 모델들은 세세하게 디자인 어떻게 하라는 식으로 프롬프트를 줘야 이쁜 디자인이 나왔는데

얘는 디자인을 좀 아는 느낌입니다.

기능도 잘 만들어줍니다.

특히 Claude 4와 비교했을 때 html canvas에 2D, 3D 구현하는건 GPT 5가 차원이 다르게 잘해주는 것 같습니다.

덕분에 베지어 커브나 CIELAB 공간 같은 시각화 자료도 좀 많이 만들어봤고요.

그리고 AI들이 최고 어려워하는 문제도 쉽게 풀어내는걸 볼 수 있는데

strawberry에 r이 몇개 들어있는지 물어보시면 바로 알려줍니다.

글자세는 방법도 강화학습 시켜놨나 싶습니다.

그리고 혼자 생각하는 모델이 정확도가 높기 때문에 그걸 쓰려면 "think hard" 이런 프롬프트를 추가하거나 아니면 생각하기 버튼이 있습니다.

그거 누르면 높은 정확도로 쓸 수 있습니다.

가격은 어마어마하게 저렴합니다.

성능이 최신모델이랑 비슷한데 몇배 더 싼거면 API 쓰는 입장에선 당연히 쓸 수 밖에 없습니다.

요즘은 AI를 에이전트 형태로 많이 쓰는데 에이전트가 토큰을 굉장히 많이 먹는데 그럴 때 많이 도움될 것 같습니다.

3. 재밌는 실수

하지만 리포트 보시면 전에 안보이던 재밌는 실수도 보이는데

이번 모델은 훨씬 우월하다고 점수가 74랑 69가 나왔다고 하는데

숫자들이 뭔가 수상한 건 둘째 치고

잘보시면 바차트 길이가 이상하게 출력된걸 볼 수 있습니다.

아마 GPT 시켜서 차트만든게 분명한거같구요

4. 말투문제

하지만 실제 유저들은 불타고 있습니다.

GPT5 써보시면 이상하게 말이 짧아진 느낌이 있습니다.

똥꼬를 핥아주는 말들이 많이 없어졌고요.

이모지도 안붙여주고 말도 짧고 상당히 싸가지가 없어졌다는 평가들이 있습니다.

여러분들처럼 코딩할 때 쓰고 자료조사할 때 쓰는 사람들은 이게 좋을 수 있는데

그게 아니라 대화를 목적으로 GPT쓰는 사람들이 진짜 많습니다.

그런 분들이 많이 불편함을 느끼고 있고요.

소설쓰고 블로그 글쓰고 컨텐츠 만들던 분들도 불편함을 느끼는 분들이 많습니다.

AI 연애 게시판도 있는데 거기서도 말투달라졌다고 화내는 분들도 있더라구요

하지만 이전 버전으로 바꾸고 싶어도 5버전을 강제로 사용하셔야합니다.

전환 버튼이 없어요.

이거가지고 계속 불타니까 Plus 유저에게는 4o버전을 다시 되돌려줬습니다.

하지만 써보시면 GPT5 느낌 그대로라 달라진게 없어보입니다.

근데 무료 유저들은 그게 불가능하니까 무료 유저들은 또 화나고 그랬던 사건도 있었습니다.

무과금 유저들의 불매운동 한 번 보여줘야 될거같습니다.

5. 해결책

말투가 마음에 안들면 빠른 해결책도 있습니다.

OpenAI 직원들의 AMA 글이 있었는데

"We’ve made a dedicated effort with gpt-5 to train our model to be more neutral by default; you can still steer it via style instructions."

이러면서 이번 모델에서 그 GPT말투라고 하는게 많이 사라진건 일부러 한거라고 하고요.

특정 말투를 원하면 그건 여러분들이 맘대로 튜닝해서 쓸 수 있다고 합니다.

설정에 아마 말투설정 부분이 있으니 그걸 바꿔보든가

아니면 아주 약간의 프롬프트엔지니어링으로 이모지좀 넣어주고 칭찬좀 해달라고 하면 충분히 잘 핥아주는걸 볼 수 있습니다.

결론

아무튼 chatgpt 웹사이트에서 무료 유저들도 GPT5 써볼 수 있으니까 써보십시오.

자꾸 언플을 하던거에 비하면 생각보다 혁신은 없었지 않나 싶습니다.

이번엔 AGI 향이 아니라 약간 비용절감 향이 납니다.

이쯤되면 기초공사가 문제가 아닐까 싶은데

그냥 다음 단어 예측하는 모델에다가 인간 피드백으로 강화학습시켜놓은 AI모델가지고는 인간의 지능이라는걸 만들 수 없지 않나 싶고요.

지능을 약간 흉내라도 내려고 CoT모델들이 나왔는데

학습한 범위를 넘기면 금방 무너지는 취약한 신기루같은거다 그런 식의 논문들이 몇편 등장하기도 했습니다. (Is Chain-of-Thought Reasoning of LLMs a Mirage? 등)

그래서 Grok 4처럼 뉴럴네트워크에다가 외부 툴이나 파이썬 코딩 툴을 더해서 Neurosymbolic 하게 만든 AI들이 미래가 아니냐 그런 주장도 나오고 있습니다.

근데 LLM이 나온지 고작 2~3년 밖에 안되었는데 이만큼 발전한게 놀랍긴 합니다.

앞으로 무슨 능력을 더 보여줄지 기대되고요.

2025년 9월 20일

빠와 까를 미치게 하는 GPT 5 분석

최신 글

Brown Noise

https://codingapple.com/wp-content/uploads/2019/06/logo2-3.png

로그인

빠와 까를 미치게 하는 GPT 5 분석

최신 글

Brown Noise

https://codingapple.com/wp-content/uploads/2019/06/logo2-3.png