最新研究表明,OpenAI 的 ChatGPT 在心理治疗对话测试中成功通过该领域图灵测试。由830名参与者参与的实验显示,AI 生成的治疗回复与人类专家回复的辨识准确率仅为51.2%-56.1%,接近随机概率水平。
该实验设置了 18 组夫妻治疗对话场景,要求受试者区分人类治疗师与 AI 的回复。数据显示,ChatGPT 在治疗联盟、共情表现和文化敏感性等核心指标上均优于人类治疗师。其回复平均长度超出人类 20%,更善于使用积极词汇和具象化表达。
研究同时发现明显的认知偏差:当受试者误将AI回复视为人类创作时,其评价最高;反之,明知是 AI 生成的回复则评分系统性偏低。这种双重标准揭示了公众对AI技术的矛盾态度。
此前墨尔本大学研究已证实,ChatGPT 针对社会困境的建议在均衡性和同理心维度优于 75% 人类咨询师。尽管AI在服务质量评估中表现优异,但多数受试者仍倾向人类咨询师。
业界分析认为,此次突破为AI医疗应用打开新空间。AI 治疗助手可有效缓解心理健康资源短缺,尤其对数字原住民群体更具吸引力。但专家强调,AI 目前仅能作为辅助工具,复杂心理治疗仍需人类专家的临床判断和情感联结。
随着技术持续迭代,AI与人类治疗师的协同模式或将成为心理健康服务的新范式。如何在技术赋能与人文关怀之间寻找平衡点,将成为行业发展的关键课题。