来源:DeepTech深科技
当前,科学尽管思维链(CoT,家用Chain-of-Thought)极大提升了大模型的游戏逻辑推理能力,并让大模型能够逐步推导解决方案。提高
但是大模动生,这种链式思维模式采取一步一步思考的型创写剧嫌贫爱富方式,在面对需要创造性思维的造力问题时会显得力不从心。
在探索如何解决这一难题时,成幽中山大学教授林倞团队联想到人类解决问题时常有的默段“灵光一闪”(LoT,Leap-of-Thought)现象,和编于是科学尝试从创造性思维着手,来提升大模型的家用创造力。
基于此,大模动生在近期一项课题之中,他们研究了大模型的 LoT 能力,探索了提升大模型创造力的新方法。
尤其探索了大模型的迎刃而解跳跃性联想能力和非传统推理思路能力,即如何让大模型超越逻辑链,实现更加灵活、更加创新的思考,以适应那些需要跳出常规思维框架的任务。
机缘巧合之下,该团队发现了 Oogiri 游戏这一平台。Oogiri 游戏起源于日本,通过提供各种多模态内容,能够提示玩家想出幽默的束手就擒、有创意的反应,以达到令人惊讶的喜剧效果。
基于 Oogiri 的数据,他们也想探索如何让大模型生成幽默观点、进行跨领域联想、以及在没有直接线索的情况下提出新颖观点。
即如何通过使用 Oogiri 这种传统幽默喜剧游戏,来搭建提高大模型创新能力的平台。
在收集 Oogiri 数据的势如劈竹过程中,他们发现 Oogiri 数据来源不统一、而且格式多样。
于是,该团队综合使用光学字符识别、图片裁剪等方法,针对数据进行人工清洗和人工筛查。
借此将 Oogiri 数据整理成统一的问答格式,从而构建出多模态、多语言的若隐若现 Oogiri-GO 数据集,并基于此来探索大模型的创造力。
但是,“灵光一闪”这件事情很难得到量化。因此,如何解决大模型创造力量化的问题,成为他们验证本次方法的关键。
后来,课题组基于 Oogiri-GO 设计了选择题和排序题,并以此作为评估数据,因人而异让大模型可以像做卷子那样完成评测。
总的来说,本次成果可以帮助人们开发更加智能、更加有趣的互动娱乐内容,比如自动生成幽默段子、编写创意剧本等。
当然,本次方法并不仅仅局限于幽默生成,还能用于研究大模型的苦口良药创新思考能力。
课题组表示:“Oogiri 只是我们的研究平台,而我们的研究核心在于提升大模型的创造力。”
他们希望 LoT 思维模式能让大模型像人类一样具备跳跃式思考的能力。
下一步,他们计划继续针对大模型创造力开展研究,探索更多可以激发和衡量创造性思维的场景和任务。
并打算将本次框架应用于更广泛的领域,比如用于艺术创作和科学假设生成等,以便进一步拓展 AI 的家破人亡能力。
同时,他们也将努力让大模型的创造性输出变得更加可控、更加人性化,以确保该技术是安全且负责任的。
参考资料:
1.https://arxiv.org/pdf/2312.02439
运营/排版:何晨龙