
Qwen 3.7-Max обогнал Claude и GPT в тесте на самообучение и оказался в 9 раз дешевле
Три топовые модели проверили на реальной агентной задаче: написать бота для Тетриса, который сам себя улучшает. Каждая модель читала свой код, запускала бенчмарки и переписывала себя за 10 итераций. Потом боты сыграли друг против друга.
Qwen 3.7-Max потратил 1.32 доллара и улучшил бота на 56%. Claude Opus 4.7 потратил 12.15 доллара и улучшился на 28%. GPT-5.5 потратил 2.85 доллара и вырос всего на 7%.
Qwen выиграл по всем показателям сразу. Самый большой прирост, в 9 раз дешевле Claude и в 2 раза дешевле GPT. Длинные агентные циклы, где модель сама себя переписывает раз за разом, это именно тот сценарий, где Qwen Max реально выигрывает.
Ежедневные подборки промптов, свежие новости и материалы об ИИ — там, где удобно. Без спама, только редакционный отбор.