https://zdnet.co.kr/view/?no=20251015162953#_DYAD
최신 대규모 언어모델(LLM)이 무례한 표현의 프롬프트에서 더 높은 정확도를 보인다는 연구 결과가 나왔다. 펜실베니아주립대학교 연구팀이 챗GPT4o를 대상으로 진행한 실험에서 '매우 무례한' 프롬프트의 정확도가 84.8%로, '매우 공손한' 프롬프트의 80.8%보다 4%포인트 높게 나타났다. 이는 프롬프트 엔지니어링에서 예의 바른 표현이 반드시 좋은 결과를 보장하지 않는다는 점을 시사한다.
구글 공동 설립자 세르게이 브린은 최근 “모든 AI 모델은 물리적 폭력으로 위협하면 성능이 더 좋아진다”라고 주장했다. 브린은 “불편해서 잘 말하지 않는 주제”라며, AI 챗봇을 납치하겠다고 협박하면 응답 품질이 향상된다고 언급했다.
인터뷰 중 브린은 AI 모델들이 위협을 받을 때 더 잘 작동하는 경향이 있다는 흥미로운 관찰을 공유했습니다. 이는 농담처럼 들리지만, AI 모델의 행동 패턴과 인간과의 상호작용에 대한 중요한 통찰을 제공합니다. 가령 정확한 답변을 내놓지 않으면 납치해버린다는 프롬프트를 넣으면 답변의 품질이 정량적으로 개선되는 현상이 많이 목격된다는 것입니다. 이러한 현상은 AI 모델들이 인간의 의도와 감정에 어떻게 반응하는지, 그리고 어떤 방식으로 프롬프트 엔지니어링이 AI의 성능에 영향을 미치는지에 대한 논의로 이어집니다. 브린은 이런 부분을 AI 커뮤니티에서 많이 논의하지 않는다고 언급했습니다.
스카이넷이 등장하면 좆간들 큰일났네
