有人说心理咨询师是最不可能被AI取代的工作,这话咋一听有道理,然而该高地正岌岌可危,因为学界和产业界已经对该领域下手了.
本人有幸应邀体验了国内知名学术大佬课题组开发的AI心理咨询机器人(开发阶段,暂不公开,为方便表述,就称呼其为倾心机器人吧),并做了相关测试,分享如下.
来看一段本人与倾心机器人有关爱情的对话视频
来看一段本人与倾心机器人有关亲情的对话视频
来看一段本人与倾心机器人有关友情的对话视频
聊天体验总结
话题内上下文理解能力本人从爱情,亲情,友情三个话题对该倾心机器人进行了相关心理咨询测试,就话题上下文共情能力进行排序,爱情>亲情>友情.
总体来说倾心机器人上下文多轮理解能力还是蛮强的,很多机器人的回答很是惊艳,给人眼前一亮的感觉,基本在话题相关知识方面有很多建设性的提问和回答.
这块儿以我对聊天机器人生成式模型的了解,只要给定足够多相关话题的对话语料,机器人的领域话题上下文理解能力都会得到加强,目前本人测验下来,友情话题欠佳,学业和爱情相关的话题机器人的上下文理解较好,可能跟初始训练语料有关.
2. 话题切换辨识能力
本人测试过一些多轮闲聊模型,其通常在话题内有较好的理解能力,然而在用户话题切换后,机器人辨识存在严重滞后问题(比如百度plato),一个明显的现象是你已经切换了话题,机器人还在旧的话题跟你兜圈圈.这一点我特意测试了下倾心机器人,本人发现倾心机器人几乎没有出现该类问题,话题转移非常流畅自然,这一点值得称赞.
3. 负强化感知能力
机器人难免出现回答错误的时候,这个时候通常用户会纠正其错误,这个纠正我认为在用户与机器人对话中是非常合理的(例如小孩子做错事,大人告诉小孩错在哪里?然后告诉他下次不要犯此类错误),机器人应具备感知用户纠正错误信息的能力(这有点儿类似心理学中的负强化的概念).这样即使机器人犯错,用户只要纠正然后机器人能够很好的回应,对用户体验来说仍然是可以被接受的.这一点儿我的体验来说,倾心机器人尝试做了(不确定是模型使然,还是额外配置,因为正常心理咨询师是不会犯这种错误的,这样的语料非常有限,但对于面向机器人的真实用户来说可能会比较常见),但做的不是特别的好,截图如下:
如果机器人能够更好的感知用户的负向表达并能够准确的回应用户以"歉意",这个体验对用户来说将会变得友好.如果机器人能够进一步追问遇到这种问题机器人该怎么进行安抚以及提问,用户回答后,机器人能够将该信息进行记忆以及回流训练,机器人将变得更加智能,它将变成一个懂你并陪伴你成长温情的机器人,他驯服了你,同样你也驯服了他,这个体验将是非常美妙的.
4. 角色一致性和关键点记忆能力
本人实测了下机器人的角色属性,发现这块儿没有很完善,比如年龄:
本人也实测了机器人是否具备关键点记忆能力,发现这块儿也是空白,截图如下:
年龄只是角色一致性的一角,还有更多有关角色一致性的属性,不过这也侧面反映出机器人现在的回答更多是模型直接输出的结果,而没有对输出话术进行精密的角色封装处理.
记忆更是机器人共情能力的基础,没有记忆能力(特别关键点记忆能力),机器人温清的回复可能短时间会引起用户的共鸣,但可能不会长久.
本人始终有个认知,单纯模型是无法支撑聊天机器人产品体验的,必须给机器人设置恒久个性属性以及长期记忆能力等,只有这样才能让用户对其产生依赖,愿意向其倾述,使机器人与人建立更为持久的关系.
5. One more thing
本人关注心理咨询机器人多年,最早接触这块儿是18年,当时看到吴恩达老师投资的一家叫woebot(现在依然活的不错)的心理咨询机器人,也进一步了解到国内最早做这块儿是15年一家叫暖丘的心理咨询平台(该平台曾经孵化出一个心理咨询机器人,后因经营不善,已消失多年),本人也曾借鉴woebot开发过一款心理咨询小程序(微信搜索:心理咨询机器人),基本实现了woebot中的CBT认知行为疗法内核.
疫情当下,心理咨询的需求有增无减.国外woebot现在势头猛进,而今有幸看到国内大佬入局该领域.如果说15年当时的NLP技术还不足以匹配该项任务,而如今22年了,随着bert预训练模型(18年)的横空出世NLP技术这几年发展迅猛,且在各产业界取得了不俗的成绩,相信NLP在该领域的应用一定会攻克技术难题,再进一步攻克产品痛点,最终造福于万千受困于心理健康的人们.
还木有评论哦,快来抢沙发吧~