Developing noise-injection methods to reveal and reduce deceptive behaviors in language models prior to deployment | grantmaking.ai

Apply to our funding roundApply

Developing noise-injection methods to reveal and reduce deceptive behaviors in language models prior to deployment | grantmaking.ai