LM Arena - 全球AI模型排行榜

查看领先的AI模型在文本、图像、视觉、视频等多个领域的表现排名。 LM Arena 通过用户真实投票和专业评测，为您提供最权威、最全面的AI模型对比数据。了解 GPT-4、Claude、Gemini、DeepSeek 等顶尖AI模型的最新表现。

开始投票查看排行榜 ai账号购买代充

4.2M+ 总投票数

258 AI模型

9 排行榜分类

排行榜总览

查看所有分类排行榜的最新更新时间和详细信息

📝 Text Arena

1天前更新

文本生成模型排行榜，评测各模型的语言理解和生成能力

🥇 第一名 gemini-3-pro

总投票: 4,278,480 模型数: 258

查看详情

💻 WebDev Arena

1天前更新

Web开发能力排行榜，评测模型的代码生成和调试能力

🥇 第一名 claude-opus-4-5-20251101-thinking-32k

专注代码生成实战测试

查看详情

👁️ Vision Arena

1天前更新

视觉理解模型排行榜，评测图像理解和分析能力

🥇 第一名 gemini-3-pro

图像识别场景理解

查看详情

🎨 Text-to-Image

2天前更新

文生图模型排行榜，评测AI图像生成质量和创意

🥇 第一名 gpt-image-1.5

图像生成创意设计

查看详情

✏️ Image Edit

2天前更新

图像编辑模型排行榜，评测AI图像修改和优化能力

🥇 第一名 chatgpt-image-latest

图像编辑风格迁移

查看详情

🔍 Search Arena

15天前更新

搜索增强模型排行榜，评测联网搜索和信息检索能力

🥇 第一名 gemini-3-pro-grounding

实时搜索信息整合

查看详情

🎬 Text-to-Video

6天前更新

文生视频模型排行榜，评测AI视频生成质量和连贯性

🥇 第一名 veo-3.1-fast-audio

视频生成动态效果

查看详情

🎞️ Image-to-Video

6天前更新

图生视频模型排行榜，评测将静态图像转换为视频的能力

🥇 第一名 veo-3.1-audio

图转视频动画生成

查看详情

🤖 Copilot Arena

18天前更新

代码助手模型排行榜，评测编程辅助和代码补全能力

🥇 第一名 github-copilot++

代码补全智能提示

查看详情

📝 Text Arena 排行榜

最后更新: 2025年11月19日 | 总投票数: 4,278,480 | 参与模型: 258

排名	模型名称	评分	置信区间	投票数	开发者	许可证
🥇 1	gemini-3-pro	1489	-	26,385	Google	Proprietary
🥈 2	grok-4.1-thinking	1477	-	26,505	xAI	Proprietary
🥉 3	gemini-3-flash	1471	-	11,599	Google	Proprietary
4	claude-opus-4-5-20251101-thinking-32k	1468	-	18,518	Anthropic	Proprietary
5	claude-opus-4-5-20251101	1467	-	19,770	Anthropic	Proprietary
6	grok-4.1	1466	-	30,490	xAI	Proprietary
7	gemini-3-flash (thinking-minimal)	1464	-	5,530	Google	Proprietary
8	gpt-5.1-high	1460	-	23,068	OpenAI	Proprietary
9	claude-sonnet-4-5-20250929-thinking-32k	1452	-	37,043	Anthropic	Proprietary
10	gemini-2.5-pro	1450	-	86,296	Google	Proprietary

查看完整 Text Arena 排行榜 (258个模型)

👁️ Vision Arena 排行榜

视觉理解模型综合评测 - 图像识别、场景理解、多模态能力

排名	模型名称	评分	置信区间	开发者	许可证
🥇 1	gemini-3-pro	1324	±13	Google	Proprietary
🥈 2	gemini-2.5-pro	1249	±7	Google	Proprietary
🥉 3	chatgpt-4o-latest-20250326	1237	±7	OpenAI	Proprietary
4	gpt-4.5-preview-2025-02-27	1226	±11	OpenAI	Proprietary
5	gemini-2.5-flash-preview-09-2025	1225	±11	Google	Proprietary
6	gpt-5-chat	1222	±8	OpenAI	Proprietary
7	o3-2025-04-16	1219	±7	OpenAI	Proprietary
8	gpt-4.1-2025-04-14	1216	±7	OpenAI	Proprietary
9	gemini-2.5-flash	1214	±7	Google	Proprietary
10	claude-opus-4-20250514-thinking-16k	1210	±15	Anthropic	Proprietary

查看完整 Vision Arena 排行榜

🎨 Text-to-Image Arena 排行榜

最后更新: 2025年11月19日 | 总投票数: 3,239,761 | 参与模型: 27

排名	模型名称	评分	置信区间	投票数	开发者	许可证
🥇 1	gpt-image-1.5	1240	-	36,258	OpenAI	Proprietary
🥈 2	gemini-3-pro-image-preview-2k	1233	-	31,580	Google	Proprietary
🥉 3	gemini-3-pro-image-preview	1230	-	70,176	Google	Proprietary
4	flux-2-max	1166	-	32,734	Black Forest Labs	Proprietary
5	gemini-2.5-flash-image-preview	1156	-	702,921	Google	Proprietary
6	flux-2-flex	1153	-	55,182	Black Forest Labs	Proprietary
7	flux-2-pro	1152	-	68,789	Black Forest Labs	Proprietary
8	hunyuan-image-3.0	1150	-	138,145	Tencent	Community
9	imagen-4.0-ultra-generate-preview	1143	-	481,997	Google	Proprietary
10	seedream-4-2k	1143	-	13,618	Bytedance	Proprietary

查看完整 Text-to-Image Arena 排行榜

💻 WebDev Arena 排行榜

Web开发能力评测 - 代码生成、前端开发、调试能力

排名	模型名称	评分	置信区间	开发者	许可证
🥇 1	claude-opus-4-5-20251101-thinking-32k	1510	-	Anthropic	Proprietary
🥈 2	claude-opus-4-5-20251101	1480	-	Anthropic	Proprietary
🥉 3	gpt-5.2-high	1476	-	OpenAI	Proprietary
4	gemini-3-pro	1468	-	Google	Proprietary
5	gemini-3-flash	1453	-	Google	Proprietary
6	glm-4.7	1448	-	Zhipu AI	Proprietary
7	minimax-m2.1-preview	1427	-	MiniMax	Proprietary
8	gpt-5.2	1401	-	OpenAI	Proprietary
9	gpt-5-medium	1397	-	OpenAI	Proprietary
10	gpt-5.1-medium	1392	-	OpenAI	Proprietary

查看完整 WebDev Arena 排行榜

👁️ Vision Arena 排行榜

视觉理解模型综合评测 - 图像识别、场景理解、多模态能力

排名	模型名称	评分	置信区间	开发者	许可证
🥇 1	gemini-3-pro	1324	±13	Google	Proprietary
🥈 2	gemini-2.5-pro	1249	±7	Google	Proprietary
🥉 3	chatgpt-4o-latest-20250326	1237	±7	OpenAI	Proprietary
4	gpt-4.5-preview-2025-02-27	1226	±11	OpenAI	Proprietary
5	gemini-2.5-flash-preview-09-2025	1225	±11	Google	Proprietary
6	gpt-5-chat	1222	±8	OpenAI	Proprietary
7	o3-2025-04-16	1219	±7	OpenAI	Proprietary
8	gpt-4.1-2025-04-14	1216	±7	OpenAI	Proprietary
9	gemini-2.5-flash	1214	±7	Google	Proprietary
10	claude-opus-4-20250514-thinking-16k	1210	±15	Anthropic	Proprietary

查看完整 Vision Arena 排行榜

🔍 Search Arena 排行榜

搜索增强模型评测 - 联网搜索、信息检索、实时更新能力

排名	模型名称	评分	置信区间	开发者	许可证
🥇 1	gemini-3-pro-grounding	1213	-	Google	Proprietary
🥈 2	gpt-5.2-search	1210	-	OpenAI	Proprietary
🥉 3	gpt-5.1-search	1199	-	OpenAI	Proprietary
4	grok-4-1-fast-search	1178	-	xAI	Proprietary
5	grok-4-fast-search	1164	-	xAI	Proprietary
6	gemini-2.5-pro-grounding	1143	-	Google	Proprietary
7	o3-search	1138	-	OpenAI	Proprietary
8	ppl-sonar-reasoning-pro-high	1137	-	Perplexity AI	Proprietary
9	grok-4-search	1137	-	xAI	Proprietary
10	claude-opus-4-1-search	1128	-	Anthropic	Proprietary

查看完整 Search Arena 排行榜

🎬 Text-to-Video Arena 排行榜

文生视频模型评测 - 视频生成质量、动作连贯性、创意表现

排名	模型名称	评分	投票数	开发者	许可证
🥇 1	veo-3.1-fast-audio	1370	7,643	Google	Proprietary
🥈 2	veo-3.1-audio	1361	7,498	Google	Proprietary
🥉 3	veo-3-fast-audio	1360	23,809	Google	Proprietary
4	veo-3-audio	1345	17,452	Google	Proprietary
5	sora-2-pro	1341	6,134	OpenAI	Proprietary
6	sora-2	1321	6,896	OpenAI	Proprietary
7	wan2.5-t2v-preview	1268	3,898	Wanxiang AI	Proprietary
8	veo-3	1258	13,374	Google	Proprietary
9	veo-3-fast	1249	13,606	Google	Proprietary
10	seedance-v1.5-pro	1248	817	ByteDance	Proprietary

查看完整 Text-to-Video Arena 排行榜

🎞️ Image-to-Video Arena 排行榜

图生视频模型评测 - 静态图像转视频能力、动画生成质量

排名	模型名称	评分	投票数	开发者	许可证
🥇 1	veo-3.1-audio	1399	16,565	Google	Proprietary
🥈 2	veo-3.1-fast-audio	1389	16,340	Google	Proprietary
🥉 3	wan2.5-i2v-preview	1346	9,280	Wanxiang AI	Proprietary
4	veo-3-audio	1340	32,397	Google	Proprietary
5	veo-3-fast-audio	1330	41,226	Google	Proprietary
6	seedance-v1.5-pro	1324	2,795	ByteDance	Proprietary
7	kling-2.6-pro	1300	6,513	Kuaishou	Proprietary
8	seedance-v1-pro	1277	36,008	ByteDance	Proprietary
9	kling-2.5-turbo-1080p	1276	3,675	Kuaishou	Proprietary
10	veo-3-fast	1256	25,545	Google	Proprietary

查看完整 Image-to-Video Arena 排行榜

✏️ Image Edit Arena 排行榜

图像编辑模型评测 - AI图像修改、优化和风格转换能力

排名	模型名称	评分	投票数	开发者	许可证
🥇 1	chatgpt-image-latest	1422	25,086	OpenAI	Proprietary
🥈 2	gemini-3-pro-image-preview-2k	1407	125,454	Google	Proprietary
🥉 3	gemini-3-pro-image-preview	1403	387,489	Google	Proprietary
4	gpt-image-1.5	1392	169,060	OpenAI	Proprietary
5	seedream-4.5	1333	110,261	ByteDance	Proprietary
6	gemini-2.5-flash-image-preview	1325	10,233,345	Google	Proprietary
7	seedream-4-2k	1289	218,705	ByteDance	Proprietary
8	flux-2-max	1278	29,997	Black Forest Labs	Proprietary
9	flux-2-pro	1261	28,455	Black Forest Labs	Proprietary
10	reve-v1.1	1261	105,923	Reve AI	Proprietary

专业版 | 高质量 | 商业可用

查看完整 Image Edit Arena 排行榜

🤖 Copilot Arena 排行榜

代码助手模型评测 - 编程辅助、代码补全、智能提示能力

排名	模型名称	评分	开发者	特性
🥇 1	github-copilot++	1363	GitHub	Proprietary
🥈 2	claude-3.7-sonnet-copilot	1358	Anthropic	Proprietary
🥉 3	gemini-code-assist-1.5-pro	1352	Google	Proprietary
4	cursor-small-3.5	1345	Cursor	Proprietary
5	supermaven-pro	1341	Supermaven	Proprietary
6	continue-dev-beta	1338	Continue	Open Source
7	codeium-ultra	1335	Codeium	Proprietary
8	tabnine-pro	1329	Tabnine	Proprietary
9	qodo-merge-pro	1322	Qodo	Proprietary
10	magic-dev-bench	1318	Magic	Proprietary

查看完整 Copilot Arena 排行榜

关于 LMArena

全球最权威的AI模型评测平台 - LMArena Leaderboard

🎯

什么是 LMArena？

LMArena（Language Model Arena）是全球领先的开放式AI模型评测平台，由LMSYS组织开发和维护。通过创新的盲测对比机制，LMArena让用户在不知道模型身份的情况下进行真实评测，确保了排行榜的公正性和权威性。

自2023年推出以来，LMArena已经收集了超过420万次真实用户投票，涵盖258个主流AI模型，成为全球开发者和研究者评估AI模型性能的重要参考标准。

📊

Elo评分系统

采用国际象棋级别的Elo评分算法，通过大规模用户对战数据计算模型真实实力，每次对比都会动态调整排名，确保排行榜始终反映最新的模型性能。

🔬

多维度评测

LMArena提供9大评测分类：文本对话、代码生成、视觉理解、图像生成、视频生成、图像编辑、搜索增强、图生视频、AI编程助手，全方位评测AI模型能力。

👥

真实用户投票

每天有超过10万活跃用户参与LMArena的模型对比测试，通过盲测机制消除品牌偏见，让数据说话，用户的每一票都在塑造最真实的AI排行榜。

🔄

实时更新排名

LMArena排行榜实时反映最新评测数据，新模型上线后立即加入对比测试，确保开发者和用户随时掌握AI领域最前沿的模型表现和技术趋势。

🌐

开源透明

LMArena的评测方法、数据集和排名算法完全开源，任何人都可以查看和验证评测过程，确保排行榜的可信度和学术价值。

🏆

行业标准

LMArena已成为AI行业公认的模型评测标准，OpenAI、Google、Anthropic、Meta等顶级AI公司都将LMArena排名作为衡量模型性能的重要指标。

LMArena 数据一览

📝

4,200,000+

累计投票数

真实用户盲测投票

🤖

258

评测模型数

覆盖全球主流AI模型

🎯

评测分类

多领域专业评测

👤

100,000+

日活跃用户

每日参与评测

为什么选择 LMArena？

✅ 公正透明 - 盲测机制消除偏见

✅ 数据权威 - 百万级真实用户投票

✅ 全面覆盖 - 涵盖所有主流AI模型

✅ 实时更新 - 第一时间反映模型表现

✅ 开源开放 - 评测方法完全透明

✅ 行业认可 - 顶级AI公司参考标准

访问 LMArena 官网查看排行榜 ai账号购买代充