Tan Akar's picture

20 232

Tan Akar

tanakr1

·

AI & ML interests

None yet

Recent Activity

liked a model 3 days ago

tencent/Hunyuan3D-1

liked a model 3 days ago

tencent/Hunyuan3D-2

liked a model 3 days ago

tencent/Hunyuan3D-2mv

View all activity

Organizations

None yet

upvoted a paper 3 days ago

MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods

Paper • 2601.21821 • Published 14 days ago • 59

upvoted 2 collections 3 days ago

PaddleOCR-VL

Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model • 5 items • Updated 1 day ago • 28

PaddleOCR-VL-1.5

Towards a Multi-Task 0.9B VLM for Robust In-the-Wild Document Parsing • 6 items • Updated 1 day ago • 9

upvoted a paper 8 days ago

Kimi K2.5: Visual Agentic Intelligence

Paper • 2602.02276 • Published 10 days ago • 225

upvoted 6 papers 18 days ago

Motion Attribution for Video Generation

Paper • 2601.08828 • Published 30 days ago • 71

Video-As-Prompt: Unified Semantic Control for Video Generation

Paper • 2510.20888 • Published Oct 23, 2025 • 50

FlowAct-R1: Towards Interactive Humanoid Video Generation

Paper • 2601.10103 • Published 28 days ago • 74

VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents

Paper • 2410.10594 • Published Oct 14, 2024 • 29

VisRAG 2.0: Evidence-Guided Multi-Image Reasoning in Visual Retrieval-Augmented Generation

Paper • 2510.09733 • Published Oct 10, 2025 • 5

VoxCPM: Tokenizer-Free TTS for Context-Aware Speech Generation and True-to-Life Voice Cloning

Paper • 2509.24650 • Published Sep 29, 2025 • 3

upvoted a paper 25 days ago

RigMo: Unifying Rig and Motion Learning for Generative Animation

Paper • 2601.06378 • Published Jan 10 • 12

upvoted 9 collections 26 days ago

VideoPrism

VideoPrism is a foundational video encoder that enables state-of-the-art performance on a large variety of video understanding tasks. • 5 items • Updated Jul 16, 2025 • 17

T5Gemma

32 items • Updated Jul 10, 2025 • 81

Gemma 3 Release

28 items • Updated Aug 11, 2025 • 608

T5Gemma 2

3 items • Updated Dec 18, 2025 • 66

Gemma Scope 2

11 items • Updated Dec 19, 2025 • 21

TranslateGemma

3 items • Updated 28 days ago • 207

Llama 4

Llama 4 release • 13 items • Updated Apr 29, 2025 • 693

GLM-4.7

3 items • Updated 24 days ago • 63

Hunyuan3D

28 items • Updated 7 days ago • 51