Тег: манипуляции в тестировании
Платформа AI Benchmarking помогает топовым компаниям подтасовывать результаты своих моделей
искусственный интеллект
AI бенчмарк
языковые модели
манипуляции в тестировании
OpenAI
Google
Meta
Llama-4
24 мая, 19:13
Исследователи обвинили ведущую платформу для тестирования искусственного интеллекта (ИИ) в предвзятости. LM Arena, популярный бенчмарк для сравнения языковых моделей (LLM), якобы предоставляет ...