Новости, обновления и кейсы в реальном времени
Anthropic передаёт разработанный инструмент оценки безопасности AI-моделей под управление независимого фонда. Это важный шаг к стандартизации AI safety в индустрии.
Исследователи Anthropic научились расшифровывать внутренние представления Claude и переводить их в понятные концепты. Это прорыв в интерпретируемости — и новый уровень понимания AI.