Create ASCII-style infographic with visual bar charts

This commit is contained in:
Gemini AI
2025-12-25 00:50:31 +04:00
Unverified
parent 193699a545
commit 1b9d4bf7fb

116
README.md
View File

@@ -29,46 +29,84 @@ GLM-4.7 demonstrates competitive performance against the newest generation of fl
### 📊 2025 AI Coding Model Performance Comparison
*Note: Best scores per category are highlighted in $\color{green}{\text{green}}$. Data sourced from [Z.ai Official Blog](https://z.ai/blog/glm-4.7).*
```mermaid
mindmap
root((GLM-4.7<br/>🏆 SOTA 2025))
Math🧮
AIME 25<br/><b>95.7%</b><br/>━━━━━━━━━
GPT: 94.0%<br/>━━━━━━━━░
Gemini: 95.0%<br/>━━━━━━━━━
DeepSeek: 93.1%<br/>━━━━━━━━░
Claude: 87.0%<br/>━━━━━━░░░
Coding💻
LiveCode<br/><b>84.9%</b><br/>━━━━━━━━━
GPT: 87.0%<br/>━━━━━━━━━
Gemini: <b>90.7%</b><br/>━━━━━━━━━
DeepSeek: 83.3%<br/>━━━━━━━━░
Claude: 64.0%<br/>━━━━░░░░
Science🔬
GPQA<br/><b>85.7%</b><br/>━━━━━━━━━
GPT: 88.1%<br/>━━━━━━━━━
Gemini: <b>91.9%</b><br/>━━━━━━━━━
DeepSeek: 82.4%<br/>━━━━━━░░░
Claude: 83.4%<br/>━━━━━━░░░
Logic🧠
HLE<br/><b>42.8%</b><br/>━━━━━━░░░
GPT: 42.7%<br/>━━━━━━░░░
Gemini: <b>45.8%</b><br/>━━━━━━▓░░
DeepSeek: 40.8%<br/>━━━━━━░░░
Claude: 32.0%<br/>━━━━░░░░
Engineering⚙
SWE-bench<br/><b>73.8%</b><br/>━━━━━━━━━
GPT: 76.3%<br/>━━━━━━━━━
Gemini: 76.2%<br/>━━━━━━━━░
DeepSeek: 73.1%<br/>━━━━━━░░░
Claude: <b>77.2%</b><br/>━━━━━━━━━
Agentic🤖
τ²-Bench<br/><b>87.4%</b><br/>━━━━━━━━━
GPT: 82.7%<br/>━━━━━━░░░
Gemini: <b>90.7%</b><br/>━━━━━━━━━
DeepSeek: 85.3%<br/>━━━━━━━━░
Claude: 87.2%<br/>━━━━━━━━░
<div align="center">
```
╔════════════════════════════════════════════════════════════════════════════════════════╗
║ 🏆 GLM-4.7: SOTA 2025 AI Model ║
╠════════════════════════════════════════════════════════════════════════════════════════╣
║ ║
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
║ │ 🧮 MATH (AIME 25) │ ║
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
║ │ │ GLM-4.7 ████████████████████ 95.7% 🥇 │ │ ║
║ │ │ Gemini ███████████████████░ 95.0% │ │ ║
║ │ │ GPT-5.1 ██████████████████░░ 94.0% │ │ ║
║ │ │ DeepSeek ███████████████░░░░ 93.1% │ │ ║
║ │ │ Claude ███████████░░░░░░░ 87.0% │ │ ║
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
║ └────────────────────────────────────────────────────────────────────────────┘ ║
║ ║
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
║ │ 💻 CODING (LiveCodeBench v6) │ ║
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
║ │ │ Gemini ████████████████████ 90.7% 🥇 │ │ ║
║ │ │ GPT-5.1 ███████████████████░ 87.0% │ │ ║
║ │ │ GLM-4.7 ████████████████░░░ 84.9% │ │ ║
║ │ │ DeepSeek ███████████████░░░░ 83.3% │ │ ║
║ │ │ Claude ██████████░░░░░░░░ 64.0% │ │ ║
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
║ └────────────────────────────────────────────────────────────────────────────┘ ║
║ ║
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
║ │ 🔬 SCIENCE (GPQA-Diamond) │ ║
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
║ │ │ Gemini ████████████████████ 91.9% 🥇 │ │ ║
║ │ │ GPT-5.1 ███████████████████░ 88.1% │ │ ║
║ │ │ GLM-4.7 ████████████████░░░ 85.7% │ │ ║
║ │ │ Claude ██████████████░░░░░ 83.4% │ │ ║
║ │ │ DeepSeek ██████████████░░░░░░ 82.4% │ │ ║
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
║ └────────────────────────────────────────────────────────────────────────────┘ ║
║ ║
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
║ │ 🧠 LOGIC (HLE w/Tools) │ ║
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
║ │ │ Gemini ██████████░░░░░░░░ 45.8% 🥇 │ │ ║
║ │ │ GLM-4.7 ██████████░░░░░░░░ 42.8% │ │ ║
║ │ │ GPT-5.1 ██████████░░░░░░░░ 42.7% │ │ ║
║ │ │ DeepSeek █████████░░░░░░░░░ 40.8% │ │ ║
║ │ │ Claude ███████░░░░░░░░░░ 32.0% │ │ ║
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
║ └────────────────────────────────────────────────────────────────────────────┘ ║
║ ║
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
║ │ ⚙️ ENGINEERING (SWE-bench) │ ║
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
║ │ │ Claude ███████████████████░ 77.2% 🥇 │ │ ║
║ │ │ GPT-5.1 █████████████████░░░ 76.3% │ │ ║
║ │ │ Gemini ███████████████░░░░ 76.2% │ │ ║
║ │ │ GLM-4.7 ██████████████░░░░░ 73.8% │ │ ║
║ │ │ DeepSeek █████████████░░░░░░ 73.1% │ │ ║
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
║ └────────────────────────────────────────────────────────────────────────────┘ ║
║ ║
║ ┌────────────────────────────────────────────────────────────────────────────┐ ║
║ │ 🤖 AGENTIC (τ²-Bench) │ ║
║ │ ┌─────────────────────────────────────────────────────────────────────┐ │ ║
║ │ │ Gemini ████████████████████ 90.7% 🥇 │ │ ║
║ │ │ GLM-4.7 ██████████████████░░ 87.4% │ │ ║
║ │ │ Claude ██████████████████░░ 87.2% │ │ ║
║ │ │ DeepSeek ███████████████░░░░ 85.3% │ │ ║
║ │ │ GPT-5.1 ███████████░░░░░░░ 82.7% │ │ ║
║ │ └─────────────────────────────────────────────────────────────────────┘ │ ║
║ └────────────────────────────────────────────────────────────────────────────┘ ║
║ ║
║ 🎯 Key Wins: Math (1st) | Agentic (2nd) | Logic (2nd) | Coding (3rd) ║
╚════════════════════════════════════════════════════════════════════════════════════════╝
```
</div>
| Category | Benchmark | **GLM-4.7** | Claude Sonnet 4.5 | GPT-5.1 High | DeepSeek-V3.2 | Gemini 3.0 Pro | Source |
| :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- |