khseon7 님의 블로그

  • 홈
  • 태그
  • 방명록

grpo 1

[논문 리뷰] MMSearch-R1: Incentivizing LMMs to Search

https://arxiv.org/abs/2506.20670 MMSearch-R1: Incentivizing LMMs to SearchRobust deployment of large multimodal models (LMMs) in real-world scenarios requires access to external knowledge sources, given the complexity and dynamic nature of real-world information. Existing approaches such as retrieval-augmented generation (RAG) aarxiv.orgAbstract현실 세계 시나리오에서 대형 멀티모달 모델(LMMs)의 안정적인 배포를 위해, 현실 세계 정..

논문 2025.06.30
이전
1
다음
더보기
프로필사진

khseon7 님의 블로그

인공지능과 관련된 이것저것 정리해보는 블로그

  • 분류 전체보기 (14) N
    • RAG (1)
    • 알고리즘 (1)
    • 논문 (11) N
    • Ray (1)

Tag

강화학습, 심층 강화 학습, ANN, dapo, Rag, Kan, grpo, ray, LMM, LLM, 강화 학습, rmok,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바