Yushi SUN's picture

3 2

Yushi SUN

Yushi98

·

AI & ML interests

None yet

Recent Activity

liked a dataset 23 days ago

STALEproj/STALE

authored a paper about 1 month ago

CRAG -- Comprehensive RAG Benchmark

authored a paper about 1 month ago

STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?

View all activity

Organizations

None yet

liked a dataset 23 days ago

STALEproj/STALE

Viewer • Updated May 7 • 400 • 432 • 3

authored 3 papers about 1 month ago

CRAG -- Comprehensive RAG Benchmark

Paper • 2406.04744 • Published Jun 7, 2024 • 46

STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?

Paper • 2605.06527 • Published May 7 • 46

VeriLLMed: Interactive Visual Debugging of Medical Large Language Models with Knowledge Graphs

Paper • 2604.23356 • Published Apr 25

upvoted 3 papers about 1 month ago

GRAVITY: Architecture-Agnostic Structured Anchoring for Long-Horizon Conversational Memory

Paper • 2605.01688 • Published May 3 • 2

STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?

Paper • 2605.06527 • Published May 7 • 46

Training Long-Context Vision-Language Models Effectively with Generalization Beyond 128K Context

Paper • 2605.13831 • Published May 13 • 88

liked a Space about 2 years ago

Open LLM Leaderboard

Track, rank and evaluate open LLMs and chatbots