Обсерватория моделей
Обсерватория моделей
Живые бенчмарки ведущих AI-моделей — и то, что обычно остаётся за кадром: как они собираются в одну систему, где каждая модель стоит на роли, которую заслужили её показатели.
Снимок лидерборда Artificial Analysis на указанную дату — реальные цифры, обновляются вручную. Подключите ключ данных, чтобы они обновлялись автоматически.
01 · Индекс
Все модели — на одних осях
Более высокий интеллект почти всегда стоит дороже и работает медленнее. Весь смысл — в этом компромиссе. Сортируйте таблицу или читайте фронтир по графику: выше и левее — умнее и дешевле.
| Модель | |||||
|---|---|---|---|---|---|
01 Claude Fable 5 Anthropic | 60 | — | — | 7.70 | 1M |
02 Claude Opus 4.8 Anthropic | 56 | 65 | 32 | 3.85 | 1M |
03 GPT-5.5 OpenAI | 55 | 68 | 122 | 4.35 | 922k |
04 GLM-5.2 Z AI | 51 | 116 | 1.4 | 0.90 | 1M |
05 Gemini 3.5 Flash Google | 50 | 165 | 18 | 1.31 | 1M |
06 Claude Sonnet 4.6 Anthropic | 47 | 52 | 101 | 2.31 | 1M |
07 Gemini 3.1 Pro Google | 46 | 132 | 25 | 1.74 | 1M |
08 Qwen3.7 Max Alibaba | 46 | 198 | 2.5 | 1.43 | 1M |
09 GPT-5.3 Codex OpenAI | 44 | 90 | 84 | 1.87 | 400k |
10 MiniMax-M3 MiniMax | 44 | 84 | 3.6 | 0.22 | 1M |
11 DeepSeek V4 Pro DeepSeek | 44 | 78 | 1.7 | 0.18 | 1M |
02 · Оркестрация
Одна система, семь ролей, в каждой — своя модель
Реальная задача — это не один промпт к одной модели, а конвейер: маршрутизация, план, рассуждение, поиск, код, текст, проверка. Qvijin отдаёт каждый шаг той модели, чьи бенчмарки его выигрывают, — а индексы выше тому подтверждение. Наведите на роль, чтобы увидеть выбор и его причину.
Разбивает цель на шаги и распределяет суб-агентов. Самое требовательное место — нужен чистый интеллект.
Выбрана за: Интеллект — 60
Так же собирается и ваш AI-штат.
Та же дисциплина, что стоит за этой панелью, — нужная модель в нужной роли, привязанная к показателю, — это то, как мы внедряем цифровых сотрудников в ваши операции.