어시스턴트 축

service

Anthropic이 개발한 AI 모델의 인격 특성을 체계적으로 분석하고 조정하는 연구 프레임워크입니다. 캐릭터 불일치를 악용한 탈옥 위험을 완화하는 데 기여합니다.

Mentioned History(0)

관련 컨텐츠