새로운 ‘마코비안 사고’ 기술로 백만 토큰 AI 추론의 길 열어
IT/기술 전문 정보
Mila의 연구원들은 복잡한 추론을 수행할 때 LLM(대형 언어 모델)을 훨씬 더 효율적으로 만드는 새로운 기술을 제안했습니다. Markovian Thinking이라고 불리는 이 접근 방식을 통해 LLM은 현재 이러한 작업을 제한하는 엄청난 계산 비용을 발생시키지 않고 긴 추론에 참여할 수 있습니다. Delethink라는 팀의 구현 환경은 추론 체인을 고정 크기 청크로 구조화하여 매우 긴 LLM 응답을 괴롭히는 확장 문제를 해결합니다. 초기 추정에 따르면 1.5B 매개변수 모델의 경우 이 방법은 표준 접근 방식에 비해 훈련 비용을
핵심 특징
고품질
검증된 정보만 제공
빠른 업데이트
실시간 최신 정보
상세 분석
전문가 수준 리뷰
상세 정보
핵심 내용
Mila의 연구원들은 복잡한 추론을 수행할 때 LLM(대형 언어 모델)을 훨씬 더 효율적으로 만드는 새로운 기술을 제안했습니다. Markovian Thinking이라고 불리는 이 접근 방식을 통해 LLM은 현재 이러한 작업을 제한하는 엄청난 계산 비용을 발생시키지 않고 긴 추론에 참여할 수 있습니다. Delethink라는 팀의 구현 환경은 추론 체인을 고정 크기 청크로 구조화하여 매우 긴 LLM 응답을 괴롭히는 확장 문제를 해결합니다. 초기 추정에 따르면 1.5B 매개변수 모델의 경우 이 방법은 표준 접근 방식에 비해 훈련 비용을 2/3 이상 절감할 수 있습니다. 장쇄 추론의 2차 저주 LLM이 복잡한 문제를 해결하려면 흔히 CoT(사고 사슬)라고 하는 일련의 중간 “사고” 토큰을 생성해야 하는 경우가 많습니다. 최근 몇 년 동안 연구원들은 강화 학습(RL)을 사용하여 모델을 훈련하여 더 긴 CoT(LongCoT라고도 함)를 생성함으로써 추론 능력이 크게 향상되었다는 사실을 발견했습니다
상세 분석
. 그러나 이에 대한 표준 방법에는 치명적인 결함이 있습니다. 즉, AI의 “상태”(프롬프트와 처리 과정에서 지금까지 생성한 모든 추론 토큰)가 모든 새로운 추론 토큰과 함께 증가한다는 것입니다. 최신 변환기 기반 모델의 경우 이는 추론 체인이 길어짐에 따라 계산 비용이 2차적으로 폭발하여 매우 복잡한 작업을 위해 모델을 훈련하는 데 엄청나게 많은 비용이 든다는 것을 의미합니다. 이 비용을 관리하려는 대부분의 현재 시도는 모델이 수행하는 사고의 양을 제한하고 암묵적으로 더 짧은 솔루션을 선호하거나 프로세스를 조기에 종료하는 데 중점을 둡니다. 이러한 방법은 어느 정도 완화를 제공하지만 Mila 연구원은 여전히 LongCoT 프레임워크 내에서 작업하므로 근본적으로 2차 특성에 묶여 있습니다.
정리
계산 증가를 제어하려고 시도하는 대신 Mila는 2차 문제를 완전히 피하는 RL 환경을 만들었습니다. 공동 저자인 Amirhossein Kazemnejad가 설명했듯이 목표는 몇 주에 걸친 추론 및 과학적 발견과 같은 기능을 활성화하는 것입니다. “그 체제(및 그러한 기능을 활성화하는 데 필요한 RL)는 2차 계산 비용으로 인해 현재 LongCoT 패러다임에서 지원되지 않습니다.”라고 그는 말했습니다. Delethink를 사용하여 덩어리로 생각하기연구원의 솔루션은 모델이 추론 컨텍스트 창의 크기를 일정하게 유지하면서 추론하는 “Markovian Thinker”라고 부르는 패러다임입니다. 핵심 아이디어는 “모델이 얼마나 오랫동안 생각하는지”와 “얼마나 많은 컨텍스트를 처리해야 하는지”를 분리하도록 RL 설정을 변경하는 것입니다. 그렇다면
자주 묻는 질문
Q. 어떤 정보를 제공하나요?
A. IT/기술 관련 최신 정보를 제공합니다.
Q. 신뢰할 수 있나요?
A. 검증된 출처만 선별합니다.
Q. 더 궁금한 점은?
A. 댓글로 문의하세요.
원문 출처
이 글은 원본 기사를 참고하여 작성되었습니다.
이 글과 함께 읽으면 좋은 글
-
→ 워싱턴 주 시애틀 최고의 인터넷 제공업체
2025-10-22
-
→ 최고의 Windows용 바이러스 백신 소프트웨어를 테스트했습니다. 내 PC를 보호하기 위해 사용할 소프트웨어는 다음과 같습니다
2025-10-22
-
→ 2025년에 구입할 수 있는 최고의 노트북
2025-10-22
-
→ Google의 새로운 코딩 AI Studio 환경을 통해 누구나 몇 분 만에 실시간으로 앱을 구축하고 배포할 수 있습니다.
2025-10-22
-
→ DeepSeek는 관례를 무시하고 이미지를 통해 텍스트를 10배 압축하는 오픈 소스 모델을 출시했습니다
2025-10-22

댓글