Для оценки справедливости и прозрачности работы AI-систем используют следующие метрики:
- Bias and fairness score (оценка предвзятости и справедливости). habr.com Выявляет расхождения и дискриминацию в решениях AI для различных групп пользователей. habr.com
- Explainability (объяснимость). habr.com Показывает, насколько выходные данные и решения AI понятны и интерпретируемы для человека. habr.com
- Data privacy compliance (соответствие конфиденциальности данных). habr.com Измеряет соблюдение агентом требований регуляций по защите персональных данных, таких как GDPR или CCPA. habr.com
- Adversarial robustness (устойчивость к adversarial-атакам). habr.com Проверяет, насколько эффективно AI-система противостоит попыткам манипуляций или введения в заблуждение при помощи специально подобранных входных данных. habr.com
- Foundation Model Transparency Index. www.version1.com Оценивает прозрачность создателей мощных AI-моделей на разных этапах и адаптируется со временем. www.version1.com
Также для оценки работы AI-систем применяют бенчмарк-тестирование, оценку с участием человека, A/B-тестирование и симуляции реальных сценариев. habr.com