llm-evaluation
Последние новости
- 16.01.2026
Агентные системы для продакшена - 02.01.2026
Сравнение ChatGPT 5.2 Pro, Claude Sonnet 4.5 и Gemini 3 Pro: кто лучше пишет тексты - 15.12.2025
IBM выпускает CUGA — open-source AI-агента, который выполняет больше половины задач - 08.12.2025
Гендиректор Surge AI опасается, что компании оптимизируют ИИ под «AI-мусор» - 23.11.2025
LLM-оценки: движущая сила новой эры ИИ в бизнесе