Pritam Sarkar

pritamqu

pritam94
pritamqu
sarkarpritam

AI & ML interests

multimodal learning with vision, language, and audio; generative modeling; large multimodal models (LMMs); multimodal LLMs (MLLMs); AI agents; alignments; representation learning; self-supervised and unsupervised learning; vision-language models; audio-visual models; foundation models; computer vision

Recent Activity

liked a dataset 28 days ago

WHB139426/Grounded-VideoLLM

commentedon a paper 10 months ago

VCRBench: Exploring Long-form Causal Reasoning Capabilities of Large Video Language Models

updated a dataset 10 months ago

pritamqu/VCRBench

View all activity

Organizations

None yet

No public activity

Pritam Sarkar

AI & ML interests

Recent Activity

Organizations

pritamqu's activity