Fu-En Yang

FuEnYang

https://fuenyang1127.github.io/

AI & ML interests

Computer Vision, Deep Learning, Vision-Language Models (VLMs), Vision-Language-Action Models (VLAs), Reasoning Models, Embodied AI

Recent Activity

authored a paper 37 minutes ago

LongSplat: Robust Unposed 3D Gaussian Splatting for Casual Long Videos

authored a paper 42 minutes ago

Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning

upvoted a paper about 10 hours ago

Imagine-then-Plan: Agent Learning from Adaptive Lookahead with World Models

View all activity

Organizations

authored a paper 37 minutes ago

LongSplat: Robust Unposed 3D Gaussian Splatting for Casual Long Videos

Paper • 2508.14041 • Published Aug 19, 2025 • 59

authored a paper 42 minutes ago

Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning

Paper • 2601.09708 • Published about 21 hours ago • 33

upvoted 3 papers about 10 hours ago

Imagine-then-Plan: Agent Learning from Adaptive Lookahead with World Models

Paper • 2601.08955 • Published 2 days ago • 9

Efficient Camera-Controlled Video Generation of Static Scenes via Sparse Diffusion and 3D Rendering

Paper • 2601.09697 • Published about 21 hours ago • 3

OpenVoxel: Training-Free Grouping and Captioning Voxels for Open-Vocabulary 3D Scene Understanding

Paper • 2601.09575 • Published 1 day ago • 22

upvoted a paper about 13 hours ago

Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning

Paper • 2601.09708 • Published about 21 hours ago • 33

upvoted 4 papers about 24 hours ago

MemoBrain: Executive Memory as an Agentic Brain for Reasoning

Paper • 2601.08079 • Published 3 days ago • 34

MemGovern: Enhancing Code Agents through Learning from Governed Human Experiences

Paper • 2601.06789 • Published 4 days ago • 73

ShowUI-π: Flow-based Generative Models as GUI Dexterous Hands

Paper • 2512.24965 • Published 15 days ago • 38

Parallel Context-of-Experts Decoding for Retrieval Augmented Generation

Paper • 2601.08670 • Published 2 days ago • 19

upvoted 9 papers 1 day ago

Semantically-Aware Rewards for Open-Ended R1 Training in Free-Form Generation

Paper • 2506.15068 • Published Jun 18, 2025 • 14

ProtoReasoning: Prototypes as the Foundation for Generalizable Reasoning in LLMs

Paper • 2506.15211 • Published Jun 18, 2025 • 39

All is Not Lost: LLM Recovery without Checkpoints

Paper • 2506.15461 • Published Jun 18, 2025 • 39

Sekai: A Video Dataset towards World Exploration

Paper • 2506.15675 • Published Jun 18, 2025 • 66

VLingNav: Embodied Navigation with Adaptive Reasoning and Visual-Assisted Linguistic Memory

Paper • 2601.08665 • Published 2 days ago • 6

Ministral 3

Paper • 2601.08584 • Published 2 days ago • 36

ArenaRL: Scaling RL for Open-Ended Agents via Tournament-based Relative Ranking

Paper • 2601.06487 • Published 5 days ago • 40

Qwen3-VL-Embedding and Qwen3-VL-Reranker: A Unified Framework for State-of-the-Art Multimodal Retrieval and Ranking

Paper • 2601.04720 • Published 7 days ago • 43

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published 4 days ago • 198

upvoted a paper 5 days ago

DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

Paper • 2601.01425 • Published 11 days ago • 49

Fu-En Yang

AI & ML interests

Recent Activity

Organizations

FuEnYang's activity