반응형 강화학습1 대형언어모델 돌파구: 모델 성능의 새로운 해법 성능 한계 속 새로운 길 찾아가기미국 AI 업계에서 지금 가장 뜨겁게 달아오르는 주제가 무엇인지 아시나요? 바로 대형언어모델(LLM)의 성능 향상 한계입니다. LLM 에 대해서 간략하게 이야기 하면, 쉽게 말해, ChatGPT 같은 AI 모델이 바로 LLM의 예인거죠. 이런 모델은 주어진 상황에 맞춰 자연스럽게 문장을 만들어낼 수 있어요. 하지만 LLM은 한 번 학습한 정보만 사용할 수 있기 때문에 실시간 정보를 처리하는 데는 한계.오픈AI와 같은 기업들은 이미 '오라이온' 프로젝트에서 사전 훈련만으로 도달 가능한 성능이 점점 한계에 가까워지고 있다는 것을 깨달았습니다. 하지만 여기서 끝이 아닙니다. 오픈AI는 이런 난관을 타개하기 위해 손 놓고 있지 않습니다. 그들은 추론과 인간 피드백을 통한 강화학습.. 2024. 11. 17. 이전 1 다음 반응형