模型補救 | 責任 AI 工具組 | TensorFlow - TensorFlow 機器學習平台

何謂 TensorFlow 模型補救？

如果您已發現機器學習模型有公平性疑慮，則有三種主要的技術介入措施可供採用

TensorFlow 模型補救程式庫提供訓練時間技術，以介入模型。

TensorFlow 模型補救程式庫提供兩種技術來解決模型中的偏差和公平性問題：MinDiff 和反事實對數機率配對 (CLP)。下表將說明這兩種技術。

	MinDiff	CLP
何時應使用這項技術？	確保模型針對敏感屬性的所有值，都能同等準確地預測偏好的標籤。達成群體機會均等。	確保模型的預測在「反事實配對」（其中特徵中參照的敏感屬性不同）之間不會改變。例如，在有害內容分類器中，「我是男人」和「我是女同志」等範例不應有不同的預測。達成某種形式的反事實公平性。
運作方式為何？	在訓練期間，針對兩組之間分數分佈的差異懲罰模型。	在訓練期間，針對反事實範例配對之間的輸出差異懲罰模型。
輸入模式	損失函數在輸出端運作，因此理論上與輸入和模型架構無關。	損失函數在輸出端運作，因此理論上與輸入和模型架構無關。

MinDiff

CLP

何時應使用這項技術？

確保模型針對敏感屬性的所有值，都能同等準確地預測偏好的標籤。

達成群體機會均等。

確保模型的預測在「反事實配對」（其中特徵中參照的敏感屬性不同）之間不會改變。例如，在有害內容分類器中，「我是男人」和「我是女同志」等範例不應有不同的預測。

達成某種形式的反事實公平性。

運作方式為何？

在訓練期間，針對兩組之間分數分佈的差異懲罰模型。

在訓練期間，針對反事實範例配對之間的輸出差異懲罰模型。

輸入模式

損失函數在輸出端運作，因此理論上與輸入和模型架構無關。