Qwen 3.7-Max обогнал Claude и GPT в тесте на самообучение и оказался в 9 раз дешевле

Qwen 3.7-Max обогнал Claude и GPT в тесте на самообучение и оказался в 9 раз дешевле

Три топовые модели проверили на реальной агентной задаче: написать бота для Тетриса, который сам себя улучшает. Каждая модель читала свой код, запускала бенчмарки и переписывала себя за 10 итераций. Потом боты сыграли друг против друга.

Qwen 3.7-Max потратил 1.32 доллара и улучшил бота на 56%. Claude Opus 4.7 потратил 12.15 доллара и улучшился на 28%. GPT-5.5 потратил 2.85 доллара и вырос всего на 7%.

Qwen выиграл по всем показателям сразу. Самый большой прирост, в 9 раз дешевле Claude и в 2 раза дешевле GPT. Длинные агентные циклы, где модель сама себя переписывает раз за разом, это именно тот сценарий, где Qwen Max реально выигрывает.

Qwen 3.7-Max обогнал Claude и GPT в тесте на самообучение и оказался в 9 раз дешевле

Подпишись,чтобыничего непропустить

читайтедальше

Lucy 2.5 умеет менять видео в реальном времени

StackBlitz выпустила Bolt Slides, презентации, которые работают как полноценные веб-приложения

Google окончательно объединяет Gemini и NotebookLM

Подпишись,
чтобы
ничего не
пропустить

читайте
дальше