khseon7 님의 블로그

  • 홈
  • 태그
  • 방명록

dapo 1

[논문 리뷰] DAPO: An Open-Source LLM Reinforcement Learning System at Scale

https://arxiv.org/abs/2503.14476 DAPO: An Open-Source LLM Reinforcement Learning System at ScaleInference scaling empowers LLMs with unprecedented reasoning ability, with reinforcement learning as the core technique to elicit complex reasoning. However, key technical details of state-of-the-art reasoning LLMs are concealed (such as in OpenAI o1 blogarxiv.orgIntroductionTest-time scaling은 더 긴 Cha..

논문 2025.04.28
이전
1
다음
더보기
프로필사진

khseon7 님의 블로그

인공지능과 관련된 이것저것 정리해보는 블로그

  • 분류 전체보기 (15)
    • RAG (1)
    • 알고리즘 (1)
    • 논문 (12)
    • Ray (1)

Tag

Rag, rmok, LLM, Kan, dapo, LMM, 강화학습, 강화 학습, grpo, ray, ANN, 심층 강화 학습,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바