16 8

Kexin Huang

CaasiHUANG

https://kexinhuang19.github.io/

KexinHUANG19

AI & ML interests

SpeechLLM, LLM/AI Safety

Recent Activity

liked a dataset about 17 hours ago

OpenMOSS-Team/OmniAction

liked a dataset about 17 hours ago

OpenMOSS-Team/OmniAction-LIBERO

liked a model about 1 month ago

OpenMOSS-Team/MOSS-VoiceGenerator

View all activity

Organizations

liked 2 datasets about 17 hours ago

OpenMOSS-Team/OmniAction

Updated about 9 hours ago • 17.2k • 125

OpenMOSS-Team/OmniAction-LIBERO

Updated about 9 hours ago • 2.17k • 57

liked 2 models about 1 month ago

OpenMOSS-Team/MOSS-VoiceGenerator

Text-to-Speech • 2B • Updated Feb 11 • 7.77k • 38

OpenMOSS-Team/MOSS-TTS

Text-to-Speech • 8B • Updated 5 days ago • 91.5k • 351

upvoted a paper about 1 month ago

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Paper • 2602.10934 • Published Feb 11 • 49

upvoted a collection about 1 month ago

MOSS-TTS

Collection

9 items • Updated 13 days ago • 24

updated a model about 1 month ago

OpenMOSS-Team/MOSS-VoiceGenerator

Text-to-Speech • 2B • Updated Feb 11 • 7.77k • 38

upvoted a paper about 2 months ago

TL-GRPO: Turn-Level RL for Reasoning-Guided Iterative Optimization

Paper • 2601.16480 • Published Jan 23 • 51

upvoted 4 papers 2 months ago

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Paper • 2601.15876 • Published Jan 22 • 92

HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding

Paper • 2601.14724 • Published Jan 21 • 75

FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Paper • 2601.13836 • Published Jan 20 • 35

ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development

Paper • 2601.11077 • Published Jan 16 • 66

liked a dataset 3 months ago

yfish/WESR-Bench

Viewer • Updated Jan 9 • 927 • 38 • 8

upvoted a paper 3 months ago

MOSS Transcribe Diarize: Accurate Transcription with Speaker Diarization

Paper • 2601.01554 • Published Jan 4 • 58

upvoted 2 papers 5 months ago

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Paper • 2511.04570 • Published Nov 6, 2025 • 242

RoboOmni: Proactive Robot Manipulation in Omni-modal Context

Paper • 2510.23763 • Published Oct 27, 2025 • 58

liked a dataset 6 months ago

zhanjun/VStyle

Viewer • Updated Jan 17 • 1.52k • 213 • 2

upvoted a paper 7 months ago

FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction

Paper • 2508.11987 • Published Aug 16, 2025 • 72

liked a model 9 months ago

fdugyt/XY_Tokenizer

Updated Sep 24, 2025 • 2

updated a dataset 9 months ago

CaasiHUANG/InstructTTSEval

Viewer • Updated Jun 23, 2025 • 2k • 499 • 13

Kexin Huang

AI & ML interests

Recent Activity

Organizations

CaasiHUANG's activity