Create ASCII-style infographic with visual bar charts
This commit is contained in:
116
README.md
116
README.md
@@ -29,46 +29,84 @@ GLM-4.7 demonstrates competitive performance against the newest generation of fl
|
||||
### 📊 2025 AI Coding Model Performance Comparison
|
||||
*Note: Best scores per category are highlighted in $\color{green}{\text{green}}$. Data sourced from [Z.ai Official Blog](https://z.ai/blog/glm-4.7).*
|
||||
|
||||
```mermaid
|
||||
mindmap
|
||||
root((GLM-4.7<br/>🏆 SOTA 2025))
|
||||
Math🧮
|
||||
AIME 25<br/><b>95.7%</b><br/>━━━━━━━━━
|
||||
GPT: 94.0%<br/>━━━━━━━━░
|
||||
Gemini: 95.0%<br/>━━━━━━━━━
|
||||
DeepSeek: 93.1%<br/>━━━━━━━━░
|
||||
Claude: 87.0%<br/>━━━━━━░░░
|
||||
Coding💻
|
||||
LiveCode<br/><b>84.9%</b><br/>━━━━━━━━━
|
||||
GPT: 87.0%<br/>━━━━━━━━━
|
||||
Gemini: <b>90.7%</b><br/>━━━━━━━━━
|
||||
DeepSeek: 83.3%<br/>━━━━━━━━░
|
||||
Claude: 64.0%<br/>━━━━░░░░
|
||||
Science🔬
|
||||
GPQA<br/><b>85.7%</b><br/>━━━━━━━━━
|
||||
GPT: 88.1%<br/>━━━━━━━━━
|
||||
Gemini: <b>91.9%</b><br/>━━━━━━━━━
|
||||
DeepSeek: 82.4%<br/>━━━━━━░░░
|
||||
Claude: 83.4%<br/>━━━━━━░░░
|
||||
Logic🧠
|
||||
HLE<br/><b>42.8%</b><br/>━━━━━━░░░
|
||||
GPT: 42.7%<br/>━━━━━━░░░
|
||||
Gemini: <b>45.8%</b><br/>━━━━━━▓░░
|
||||
DeepSeek: 40.8%<br/>━━━━━━░░░
|
||||
Claude: 32.0%<br/>━━━━░░░░
|
||||
Engineering⚙️
|
||||
SWE-bench<br/><b>73.8%</b><br/>━━━━━━━━━
|
||||
GPT: 76.3%<br/>━━━━━━━━━
|
||||
Gemini: 76.2%<br/>━━━━━━━━░
|
||||
DeepSeek: 73.1%<br/>━━━━━━░░░
|
||||
Claude: <b>77.2%</b><br/>━━━━━━━━━
|
||||
Agentic🤖
|
||||
τ²-Bench<br/><b>87.4%</b><br/>━━━━━━━━━
|
||||
GPT: 82.7%<br/>━━━━━━░░░
|
||||
Gemini: <b>90.7%</b><br/>━━━━━━━━━
|
||||
DeepSeek: 85.3%<br/>━━━━━━━━░
|
||||
Claude: 87.2%<br/>━━━━━━━━░
|
||||
<div align="center">
|
||||
|
||||
```
|
||||
╔════════════════════════════════════════════════════════════════════════════════════════╗
|
||||
║ 🏆 GLM-4.7: SOTA 2025 AI Model ║
|
||||
╠════════════════════════════════════════════════════════════════════════════════════════╣
|
||||
║ ║
|
||||
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
|
||||
║ │ 🧮 MATH (AIME 25) │ ║
|
||||
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
|
||||
║ │ │ GLM-4.7 ████████████████████ 95.7% 🥇 │ │ ║
|
||||
║ │ │ Gemini ███████████████████░ 95.0% │ │ ║
|
||||
║ │ │ GPT-5.1 ██████████████████░░ 94.0% │ │ ║
|
||||
║ │ │ DeepSeek ███████████████░░░░ 93.1% │ │ ║
|
||||
║ │ │ Claude ███████████░░░░░░░ 87.0% │ │ ║
|
||||
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
|
||||
║ └────────────────────────────────────────────────────────────────────────────┘ ║
|
||||
║ ║
|
||||
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
|
||||
║ │ 💻 CODING (LiveCodeBench v6) │ ║
|
||||
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
|
||||
║ │ │ Gemini ████████████████████ 90.7% 🥇 │ │ ║
|
||||
║ │ │ GPT-5.1 ███████████████████░ 87.0% │ │ ║
|
||||
║ │ │ GLM-4.7 ████████████████░░░ 84.9% │ │ ║
|
||||
║ │ │ DeepSeek ███████████████░░░░ 83.3% │ │ ║
|
||||
║ │ │ Claude ██████████░░░░░░░░ 64.0% │ │ ║
|
||||
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
|
||||
║ └────────────────────────────────────────────────────────────────────────────┘ ║
|
||||
║ ║
|
||||
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
|
||||
║ │ 🔬 SCIENCE (GPQA-Diamond) │ ║
|
||||
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
|
||||
║ │ │ Gemini ████████████████████ 91.9% 🥇 │ │ ║
|
||||
║ │ │ GPT-5.1 ███████████████████░ 88.1% │ │ ║
|
||||
║ │ │ GLM-4.7 ████████████████░░░ 85.7% │ │ ║
|
||||
║ │ │ Claude ██████████████░░░░░ 83.4% │ │ ║
|
||||
║ │ │ DeepSeek ██████████████░░░░░░ 82.4% │ │ ║
|
||||
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
|
||||
║ └────────────────────────────────────────────────────────────────────────────┘ ║
|
||||
║ ║
|
||||
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
|
||||
║ │ 🧠 LOGIC (HLE w/Tools) │ ║
|
||||
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
|
||||
║ │ │ Gemini ██████████░░░░░░░░ 45.8% 🥇 │ │ ║
|
||||
║ │ │ GLM-4.7 ██████████░░░░░░░░ 42.8% │ │ ║
|
||||
║ │ │ GPT-5.1 ██████████░░░░░░░░ 42.7% │ │ ║
|
||||
║ │ │ DeepSeek █████████░░░░░░░░░ 40.8% │ │ ║
|
||||
║ │ │ Claude ███████░░░░░░░░░░ 32.0% │ │ ║
|
||||
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
|
||||
║ └────────────────────────────────────────────────────────────────────────────┘ ║
|
||||
║ ║
|
||||
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
|
||||
║ │ ⚙️ ENGINEERING (SWE-bench) │ ║
|
||||
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
|
||||
║ │ │ Claude ███████████████████░ 77.2% 🥇 │ │ ║
|
||||
║ │ │ GPT-5.1 █████████████████░░░ 76.3% │ │ ║
|
||||
║ │ │ Gemini ███████████████░░░░ 76.2% │ │ ║
|
||||
║ │ │ GLM-4.7 ██████████████░░░░░ 73.8% │ │ ║
|
||||
║ │ │ DeepSeek █████████████░░░░░░ 73.1% │ │ ║
|
||||
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
|
||||
║ └────────────────────────────────────────────────────────────────────────────┘ ║
|
||||
║ ║
|
||||
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
|
||||
║ │ 🤖 AGENTIC (τ²-Bench) │ ║
|
||||
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
|
||||
║ │ │ Gemini ████████████████████ 90.7% 🥇 │ │ ║
|
||||
║ │ │ GLM-4.7 ██████████████████░░ 87.4% │ │ ║
|
||||
║ │ │ Claude ██████████████████░░ 87.2% │ │ ║
|
||||
║ │ │ DeepSeek ███████████████░░░░ 85.3% │ │ ║
|
||||
║ │ │ GPT-5.1 ███████████░░░░░░░ 82.7% │ │ ║
|
||||
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
|
||||
║ └────────────────────────────────────────────────────────────────────────────┘ ║
|
||||
║ ║
|
||||
║ 🎯 Key Wins: Math (1st) | Agentic (2nd) | Logic (2nd) | Coding (3rd) ║
|
||||
╚════════════════════════════════════════════════════════════════════════════════════════╝
|
||||
```
|
||||
|
||||
</div>
|
||||
|
||||
| Category | Benchmark | **GLM-4.7** | Claude Sonnet 4.5 | GPT-5.1 High | DeepSeek-V3.2 | Gemini 3.0 Pro | Source |
|
||||
| :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- |
|
||||
|
||||
Reference in New Issue
Block a user