meng shao's picture

30 10

meng shao

meng-shao

·

AI & ML interests

None yet

Organizations

None yet

meng-shao's activity

upvoted 2 papers 1 day ago

MAP-Neo: Highly Capable and Transparent Bilingual Large Language Model Series

Paper • 2405.19327 • Published 3 days ago • 34

T2V-Turbo: Breaking the Quality Bottleneck of Video Consistency Model with Mixed Reward Feedback

Paper • 2405.18750 • Published 3 days ago • 14

upvoted a paper 2 days ago

Yuan 2.0-M32: Mixture of Experts with Attention Router

Paper • 2405.17976 • Published 4 days ago • 15

upvoted a paper 11 days ago

FIFO-Diffusion: Generating Infinite Videos from Text without Training

Paper • 2405.11473 • Published 13 days ago • 50

upvoted a paper 17 days ago

What matters when building vision-language models?

Paper • 2405.02246 • Published 29 days ago • 87

upvoted a paper 18 days ago

Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots

Paper • 2405.07990 • Published 19 days ago • 15

upvoted 5 papers 29 days ago

Customizing Text-to-Image Models with a Single Image Pair

Paper • 2405.01536 • Published 30 days ago • 17

StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation

Paper • 2405.01434 • Published 30 days ago • 44

LLM-AD: Large Language Model based Audio Description System

Paper • 2405.00983 • Published about 1 month ago • 13

WildChat: 1M ChatGPT Interaction Logs in the Wild

Paper • 2405.01470 • Published 30 days ago • 53

Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models

Paper • 2405.01535 • Published 30 days ago • 102

upvoted 13 papers about 1 month ago

STT: Stateful Tracking with Transformers for Autonomous Driving

Paper • 2405.00236 • Published Apr 30 • 7

Automatic Creative Selection with Cross-Modal Matching

Paper • 2405.00029 • Published Feb 28 • 7

Self-Play Preference Optimization for Language Model Alignment

Paper • 2405.00675 • Published about 1 month ago • 18

SemantiCodec: An Ultra Low Bitrate Semantic Audio Codec for General Sound

Paper • 2405.00233 • Published Apr 30 • 12

Paint by Inpaint: Learning to Add Image Objects by Removing Them First

Paper • 2404.18212 • Published Apr 28 • 20

Clover: Regressive Lightweight Speculative Decoding with Sequential Knowledge

Paper • 2405.00263 • Published May 1 • 13

Is Bigger Edit Batch Size Always Better? -- An Empirical Study on Model Editing with Llama-3

Paper • 2405.00664 • Published about 1 month ago • 17

A Careful Examination of Large Language Model Performance on Grade School Arithmetic

Paper • 2405.00332 • Published May 1 • 24

InstantFamily: Masked Attention for Zero-shot Multi-ID Image Generation

Paper • 2404.19427 • Published Apr 30 • 65

Spectrally Pruned Gaussian Fields with Neural Compensation

Paper • 2405.00676 • Published about 1 month ago • 8

Extending Llama-3's Context Ten-Fold Overnight

Paper • 2404.19553 • Published Apr 30 • 28

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22 • 238

Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment

Paper • 2404.12318 • Published Apr 18 • 14

upvoted a paper about 2 months ago

Rho-1: Not All Tokens Are What You Need

Paper • 2404.07965 • Published Apr 11 • 80

upvoted 4 papers 2 months ago

Getting it Right: Improving Spatial Consistency in Text-to-Image Models

Paper • 2404.01197 • Published Apr 1 • 29

Transformer-Lite: High-efficiency Deployment of Large Language Models on Mobile Phone GPUs

Paper • 2403.20041 • Published Mar 29 • 34

Gecko: Versatile Text Embeddings Distilled from Large Language Models

Paper • 2403.20327 • Published Mar 29 • 44

DoRA: Weight-Decomposed Low-Rank Adaptation

Paper • 2402.09353 • Published Feb 14 • 21

upvoted a paper 3 months ago

Instruct-Imagen: Image Generation with Multi-modal Instruction

Paper • 2401.01952 • Published Jan 3 • 29