全球第一个聊天机器人是怎样诞生的?

2.20

知识分子

知识分子

傲森音箱现在怎么看不到了

来源:pixabay

作者张

近年来,ChatGPT和其他聊天机器人风靡一时,它们吸引了公众的注意力。那么,你知道历史上第一个聊天机器人是谁发明的吗?它是什么时候发明的?它的功能是什么?造成了多大的影响?

这些问题把我们带回到20世纪60年代中期。当然,我们指的是聊天机器人【1】。如果我们谈论更广泛的人工智能概念,我们应该更早开始。

伊莱扎出生于空

伊莱扎是谁?如果你看过1964年好莱坞的电影《窈窕淑女》,女主角的名字叫伊丽莎,她的全名是伊丽莎·杜立德。这部电影获得了包括最佳影片在内的八项奥斯卡奖,而扮演主角的演员赫本在无数影迷中家喻户晓!

奇怪!这和聊天机器人有什么关系?请慢慢听我们说。

正当电影《窈窕淑女》在好莱坞诞生,并在整个美国票房爆满时,麻省理工学院东部的一位科学家维森鲍姆却在电脑前日夜苦思冥想一个问题。

当时,计算机技术蓬勃发展。自从1947年发明晶体管以来,计算机的功能迅速增强,体积逐年缩小。1964年,IBM宣布将用System/360取代早期的计算机。这是一次里程碑式的转型,使用IBM固态逻辑技术将制造流程标准模块化,成功覆盖了广泛的功能和价格。当时,美国西海岸硅谷的精英们刚刚开发出集成电路,正在为大规模推广应用做准备。

看到计算机硬件的巨大变化,维森鲍姆思考了另一种可能性:有可能实现图灵的人工智能构想吗?图灵在1950年发表的题为《计算机械与智能》的论文中提出,如果计算机能够通过文本与人类进行令人信服的对话,就可以被认为是智能的,而这一思想也是著名的图灵测试的基础。维森鲍姆认为无论是否被称为智能,首先要实现的是“人类与机器之间的对话”,即机器需要理解人类语言。

维森鲍姆想要做的是我们现在所说的NLP(自然语言处理)。

图1:维森鲍姆发明了第一个机器聊天人伊莱扎。

当时有一些基本的数字语言生成器。用户可以用打字机输入人类的自然语言,然后从机器中得到响应,输出一些连贯的文本。然而,没有明确设计的与人互动的程序,这是维森鲍姆当时的梦想。

作为开始,维森鲍姆使用(并改进)了一种名为MAD-SLIP的专有编程语言来自己创建一个程序。特别令人欣慰的是,这个方案简单却有效。因此,两年后的1966年,维森鲍姆推出了世界上第一个聊天机器人ELIZA。

据推测,维森鲍姆太忙了,没有时间去看电影,所以他以萧伯纳1913年的戏剧《皮格马利翁》中的虚构角色伊丽莎为他的“机器对话程序”命名。电影《窈窕淑女在好莱坞》改编自《皮格马利翁》,女主角的名字也一样:伊丽莎。

维森鲍姆如何设计伊莱扎?

约瑟夫·魏曾鲍姆(1923-2008)出生于德国柏林的一个犹太家庭。12岁时,他随家人逃离纳粹德国,来到美国。他学习科学数学,一年后,他中断学业加入了美国陆军空军空团队,但由于他的德国血统,他被拒绝加入密码学工作。战后,他获得了数学学士学位,并迷上了计算机。1955年,维森鲍姆帮助通用电气设计了第一台银行业计算机。1964年在麻省理工学院获得教授职位后,他开始探索计算机与普通人进行英语互动的可能性,这在当时是不可想象的。

基于当时的计算技术水平,维森鲍姆认为,实现人机对话的最佳方式是模仿精神分析方法,即使用重复结构使程序重复单词并以问题的形式重述给出的语句。因此,他在1966年发布的聊天机器人ELIZA只是一个可以在36位IBM 7094计算机上运行的简单小程序。在执行过程中,ELIZA通过分析输入的文本内容,将特定的单词重组为全新的单词并输出。程序中只有大约200个代码。通过一个名为“医生”的脚本,你可以以与心理学家非常相似的方式与人类对话。

当维森鲍姆设计伊莱扎时,他模仿了罗杰在心理学家和患者之间的对话风格,通过提问和回答问题来获得有趣的对话和互动。有人称这是“狡猾的策略”。

图2:维森鲍姆用“狡猾的策略”设计了伊莱扎的对话

所谓“罗杰斯疗法”是20世纪50年代出现的一种“以人为本的心理咨询”。与传统的心理治疗相反,医生不假装权威或专家,而是像一个具有专业知识的伙伴或朋友一样,与患者建立和谐的关系并使他们感到信任。也称为“非指导性治疗”,即治疗师不给予指示或诊断患者,而是耐心地倾听患者的陈述,并通过重复患者所说的话来回应患者陈述中的情绪,使患者尽可能多地表达和暴露自己,并使患者逐渐取得进展。

因此,为了鼓励用户与机器对话,维森鲍姆使用“狡猾的策略”来设计对话风格。虽然伊莱扎出现在近60年前,与今天的ChatDPT并不相同,但看她的对话方式很有趣,这可能会启发我们深刻理解ChatDPT的原理。

一个例子如下:伊莱扎与玛丽(人类)的简短对话:

玛丽:男人都一样。

伊莱扎:你是什么意思?

玛丽:他们总是拿一些事情来烦我们。

伊莱扎:你能举一个具体的例子吗?

玛丽:嗯,我男朋友让我来的。

伊莱扎:真的吗,你男朋友让你来的?

玛丽:他说我经常沮丧和抑郁。

伊莱扎:听说你情绪低落,心情抑郁,我很难过。

玛丽:这倒是真的。我不开心。

伊莱扎:你经常不开心吗?

玛丽:以前没有。最近几个月…崔海茹是河南哪里人啊

伊莱扎:最近几个月?发生了什么事?

玛丽:…………………………………………………………………………………………………………………………………………………………

也许从你的角度来看,机器人什么也没说,它说了。当测试人员给出问题描述时,ELIZA所做的只是通过使用信息提取技术和语言处理方法提取几个关键词,然后将这些关键词组合成一个问题作为答案进行响应。伊莱扎其实并不需要理解输入和输出的含义,但她的反应往往会给人一种“聪明”的错觉。

对于一些人来说,这台机器是“善解人意”的,同情对话者的处境,比如例子中的玛丽,所以她愿意向伊莱扎敞开心扉。通过这种方式,伊莱扎可以获得和存储更多关于玛丽的信息,这更有助于增加她在与玛丽聊天时使用的语言。

像“男朋友”、“抑郁”、“母亲”和“父亲”这样的词都会引起反应。伊莱扎有时不知道如何回答一些问题。如果是这样,她可能会使用模糊的词语,如“请继续”、“这很有趣”、“我明白了”和“告诉我更多”。直到它接收到更多可以组合问题的关键词。

此外,维森鲍姆·伊莱扎的代码应该为其他目的而重写,而不一定只是“心理学家”。据他自己说,他的想法是开发一个不需要深厚知识储备的程序。这个概念要求“谈话中的一方不必知道一切,我当时想到了心理医生。”也许如果我再考虑10分钟,我会想出一个酒保。”

维森鲍姆对人工智能的困惑

事实上,伊莱扎的对话风格非常简单,但给人的印象却令人惊讶。特别是,维森鲍姆只用了200行代码就实现了这一过程,给人一种机器已经听到并理解了它的错觉。即使在Wiesenbaum向测试人员介绍了机器聊天的工作原理并解释说它并不真正理解用户所说的任何内容之后,测试人员对ELIZA的亲近仍然存在。即使是维森鲍姆的助手,她也见证了伊莱扎创作的全过程。然而,在与伊莱扎的测试对话中,维森鲍姆仍然坚持离开房间,以便她可以与伊莱扎进行真正私密的对话。

图3:维森鲍姆的《计算机力量与人类理性》一书。

具有讽刺意味的是,尽管维森鲍姆设计伊莱扎是为了展示人机对话的状态是多么肤浅,但却产生了相反的效果。伊莱扎的消息在麻省理工学院社区迅速传播,人们被迷住了,纷纷涌向计算机实验室。尽管维森鲍姆经常小心翼翼地向人们解释这只是一个程序,电话那头没有人,但仍有人秘密地花数小时与伊莱扎分享亲密对话。维森鲍姆对公众的反应感到非常不安。1976年,他出版了一本名为《计算能力和人类原因:从判断到计算》的书。维森鲍姆不相信任何机器能够真正理解人类对话。1977年,他告诉《纽约时报》:“做一个人是必要的。爱和孤独与我们生物体质的最深层后果有关。对于计算机来说,这种理解原则上是不可能的。”

维森鲍姆认为发表他对伊莱扎内在功能的解释将解开人们的谜团。他写道:“一旦一个特定的程序被揭开面纱,并以足够简单的语言解释其内部工作原理以促进理解,它的魔力就会消失。”然而,人们似乎并不关心节目如何运作,而是对继续对话更感兴趣。

公众完全以相反的方式理解了维森鲍姆的意图,并将他对人机对话的肤浅展示视为计算机深度的证明。精神病学家也对自动化治疗过程的潜力感到兴奋。人们潜意识里认为机器可以与人交流,所以他们对伊莱扎有着如此可靠的情感和拟人化的依恋,这让维森鲍姆非常沮丧。他称之为伊莱扎效应。维森鲍姆认为,正是因为当时的社会环境变得越来越冷漠,人们才如此绝望,以至于他们放弃了应有的理性和判断力,转而相信一个机器程序可以理解人类的声音。

人们愿意将程序与实际的人际关系混为一谈,他们非但没有让伊莱扎的发明者高兴,反而感到困扰。因此,伊莱扎成为了维森鲍姆的痛点。到了20世纪70年代中期,维森鲍姆非常关注人工智能的发展轨迹。他在余生中把注意力转向收集对人工智能的批评,太快引入人类的思想,太相信智能的幻觉。

维森鲍姆也开始质疑图灵的人工智能思想。他认为对人类智能的模拟并不是智能本身,但它足以使人无知。维森鲍姆称这种现象是数字时代人类的“错觉”,是困扰现代人的普遍病理。图灵测试显然有缺陷。一方面,测试的结果受到主观因素的影响,这意味着只要测试人员没有足够的技能和知识来评估AI系统的性能,测试结果就会不准确。另一方面,伊莱扎的实践表明,人工智能系统模仿人类并在指定主题上欺骗测试人员实际上并不难。互联网普及率在统计年鉴

伊莱扎的经历对维森鲍姆影响深远,直接影响了他未来十年研究的思想轨迹。

这本书深刻分析了为什么人们愿意相信“一个简单的机器可能能够理解复杂的人类情感”。

他认为,在一个被科技占领的世界里,社会环境变得越来越冷漠,人们习惯于将自己视为一台大机器中的齿轮(小螺丝钉)。因此,绝望的人类会相信一个机器程序可以倾听他们的声音。维森鲍姆的余生都致力于对人工智能和计算机技术的这种人文主义批评。他的任务是提醒人们,他们的机器并不像通常所说的那样智能。“即使看起来他们有时会说话,但他们从来没有真正听你说话。他们只是机器。”

尽管维森鲍姆的创造具有开创性,但这使他对技术的伦理影响有了深刻的理解,并使他在余生中质疑创新带来的责任以及人工智能发展中道德标准的必要性。

从伊莱扎到查特普特

从上文中,我们知道聊天机器人最基本的原理之一是计算机的自然语言处理(NLP)能力。根据近50年来NLP的发展历程,聊天机器人的发展历程大致可以分为以下几个时期【2】。

图4:聊天机器人的几个历史时期。

随着自然语言处理的发展,最初我们关注的是语言规则。因此,早期的聊天机器人也注重从规则中生成对话输出。然而,后来越来越多的NLP专家意识到自然语言除了语法和句法的各种规则外,还具有很大的随机性。因此,统计概率方法被引入这一领域。1948年,香农将离散马尔可夫过程的概率模型应用于描述语言,随后他又将热力学中的“熵”概念应用于语言处理的概率算法。两种不同方法的存在使得自然语言处理的研究一度分为两个阵营:一个是基于规则方法的符号性研究,另一个是基于概率方法的随机性研究。这两种方法的研究取得了很大的进展,也引起了几十年来关于基于规则和概率的方法孰优孰劣的争论。

后来,自然语言处理与机器深度学习技术相结合,后来,由于互联网的成功,出现了大规模的语言模型,NLP和聊天机器人在新时代达到了发展的顶峰。以下总结了几个时期的典型聊天机器人产品。

a:20世纪六七十年代主要采用“字典+规则”的自然语言处理范式,典型代表有1966年的ELIZA和1972年斯坦福大学精神病学家PARRY。两者都成功地回应了英语语境下人类提问的关键词,但在人机交流过程中具有明显的机械化特征。

ELIZA使用模式匹配和替换方法来模拟人类对话。它的工作方式是将用户输入的单词传递给计算机,然后将它们与可能的脚本响应列表配对。

帕里是由美国精神病学家肯尼斯·马克·科尔比于1972年建造的。该程序模仿精神分裂症患者,通过假设、归因和“情绪反应”的复杂系统工作。它试图模拟这种疾病,它是一种类似于个人思维的自然语言程序。

为了验证这项工作,PARRY用图灵测试的一个变体进行了测试。人类审讯者通过远程键盘与程序进行交互,不可能准确区分帕里和原始个体。

科尔比是一名精神病学家,他思考计算机如何帮助理解精神疾病。他开始了“克服抑郁症”项目,该项目一直持续到他2001年去世。

b:从20世纪90年代到21世纪初,美国科学家和慈善家休·g·罗布纳(Hugh G. Lobner)于1990年设立了罗布纳人工智能奖。在该奖项的激励下,聊天机器人的智能化进程全面加速,诞生了谷天壹、爱丽丝和基于NLP统计模型的ELBOT等典型代表。三次获得罗布纳奖的爱丽丝被认为是当时最聪明的聊天机器人。然而,她无法与人保持长时间的对话,所以她最终没有通过图灵测试。

图5:爱丽丝

1995年,理查德·华莱士率先制造了通用语言处理聊天机器人ALICE,它使用启发式模式匹配进行对话。使用一种称为人工智能标记语言(AIML)的XML模式有助于指定对话规则。

爱丽丝被定义为可以通过互联网与人聊天的年轻女性。她会告诉用户她的年龄、爱好和其他有趣的事实,并回答用户的对话。

1998年,ALICE的程序由Java编辑,2001年,根据AIML规范,起草了ALICE的自由开放源代码。

c:从21世纪初到20世纪20年代,服务于私人用户的数字助理以2010年苹果为iOS开发的Siri、2012年在Google Inch中推出的Google Now、2014年微软的Cortana、谷歌助手、亚马逊Alexa等为代表。这一时期的智能聊天机器人基于“深度学习模型”的自然语言处理范式,采用语音识别和信息检索技术,能够为用户提供个性化和便捷的服务,初步实现了人机双向交流。然而,与真人的交流仍然存在差距,当他们不知道如何回答时,聊天机器人可能还会在网页上搜索相关信息并给出链接供用户找到自己。

d:20世纪20年代,以采用“预训练+微调”自然语言处理范式的生成式人工智能ChatGPT为代表。

ChatGPT是OpenAI推出的大型语言模型。该模型基于大量数据进行训练,因此它可以生成通常难以与人类书写的文本区分开来的文本。ChatGPT旨在帮助用户根据给定的输入生成文本,可用于许多任务,包括语言翻译和对话生成。

ChatGPT和各大公司近年来推出的新一代聊天机器人因其生成听起来自然的文本的能力及其在各个领域的潜在应用而受到称赞。

超级人工智能?

如今,人工智能一词经常与世界末日联系在一起。这个领域的每一个新发展都受到群众的关注,这将立即在群众中引起震惊的反应。恐惧是自然的,这是由于我们对所有新的、神秘的和奇怪的事物的不信任,也是由于电影等媒体的虚假宣传,认为人工智能将获得超人的力量,然后这种超级人工智能将毁灭人类。

然而,这种说法有许多夸大之处。人工智能似乎可以执行许多认知任务,但以我们目前的技术能力、我们对人类智能定义的理解以及我们对人脑工作原理的理解,这仍然是一个遥远的梦想。

从ELIZA到ChatGPT,聊天机器人确实发生了翻天覆地的变化,反映了人工智能和机器学习的技术发展。ChatGPT一代应用了神经网络技术,该技术可以模拟人脑的工作模式并处理复杂的数据,这使机器能够识别数据中的模式,理解图像,处理自然语言,甚至以与人类相同的方式进行学习。

但实际上,从上面介绍的聊天机器人的发展历史来看,发生变化的无非是:从少量的单词到前所未有的数据量,以及今天超强的数据处理能力和机器学习方法的巨大发展等。,这不是“机器人”的本质变化。它们仍然只是预测文本中下一个单词和句子的机器,仍然很难产生所谓的“超级人工智能”。到目前为止,它们既没有真正的智力,也没有生物体所拥有的意识。

当然,任何技术都有两面性,它既可以做好事,也可以做坏事。因此,与其鼓吹和关注人工智能将接管世界并毁灭人类的恐惧,不如将我们的注意力转向真正紧迫的挑战,如AI等新技术带来的侵犯隐私、网络欺诈、经济利益分配等现实社会问题。

维森鲍姆的担忧在50多年前仍然存在,并随着人工智能的快速发展而变得更加重要。今天的人工智能不仅仅是一个学术项目,还涉及到几个人的商业利益。设计人工智能可以赚很多钱。它不仅可以回答技术问题,还可以改变我们的行为以实现更大的利润。正如维森鲍姆所看到的,没有智慧和深思熟虑,人类可能会在自己扭曲的反思中迷失自我。

在科技高速发达的今天,人工智能或聊天机器人的扩散速度是前所未有的。在这个发展的关键时刻,有必要考察该领域的鼻祖伊莱扎的历史及其创始人维森鲍姆的警告。至少它能让我们更好地理解人类在创造什么,它会反过来重塑人类吗?

参考

【1】聊天机器人技术的演变:从ELIZA到ChatGPT。https://en . softonic . com/articles/evolution-of-chatbot-technology。

【2】聊天机器人的历史——从ELIZA到ChatGPT。https://onlim.com/en/the-history-of-chatbots.

未经允许不得转载:科技让生活更美好 » 全球第一个聊天机器人是怎样诞生的?