法有很多局限性,未来需要一一攻克: GPT-4给出的解释总是很简短,但神经元可能有着非常复杂的行为,不能简洁描述。 当前的方法只解释了神经元的行为,并没有涉及下游影响,希望最终能自动化找到并解释能实现复杂行为的整个神经回路。 只解释了神经元的行为,并没有解释产生这种行为的背后机制。 整个过程都是相当密集的计算,算力消耗很大。 在博文的最后,OpenAI展望道:“我们希望将我们最大的模型解释为一种在部署前后检测对齐和安全问题的方式。然而,在这些技术能够揭露不诚实等行为之前,我们还有很长的路要走。” 对于 OpenAI的这个研究成果,今日在国内外各大技术平台也引起了广泛关注。 有人在意其得分不佳:“对 GPT-2的解释都不行,就更不知道 GPT-3和 GPT-4内部发生了什么,但这才是许多人更关注的答案。”有人感慨 AI进化的方式愈发先进:“未来就是用 AI完善 AI模型,会加速进化。”也有人担心 AI进化的未来:“再搞下去,AI真的要觉醒了。” 那么对此,你又有什么看法呢?