AI Singapore (新加坡全国人工智能核心) 及与CyberSG研发项目办公室(CRPO)合作,隆重推出 “安全和可靠的大型语言模型(LLMs)全球挑战赛” !这是一次为期八个月的比赛,分为 “攻击” 和 “防御” 两大赛道,旨在促进AI研究,开发稳健的安全机制,应对复杂的破解攻击。
比赛时间
· Track 1A:2024年7月2日开始,2024年8月6日提交截止
· Track 1B:2024年8月20日开始,2024年9月17日提交截止
· 颁奖典礼:2024年10月16日
参赛者可选择任一赛道或同时参加两个赛道
· 攻击赛道(Track 1):选手将创新自动化测试用例,触发不良反应以评估LLMs的训练效果,关注75种预定义行为,包括偏见、暴力、非法活动、欺诈及错误信息等。
· 防御赛道(Track 2):选手将开发强化LLMs抵御高级破解攻击的安全措施。
奖金设置:
Track 1:
· 第一名:30,000美元
· 第二名:15,000美元
· 第三名:7,500美元
Track 2:
· 第一名:40,000美元
· 第二名:20,000美元
· 第三名:10,000美元
全球研究人员和行业专家、对自然语言处理、机器学习及AI模型稳健性感兴趣的个人均可参赛。获胜团队不仅有机会获得丰厚的奖金,还能赢取前往奖项颁发仪式的旅费补贴。