虚拟助理查看源代码讨论查看历史
虚拟助理(virtual assistant)是一种能替个人执行任务或服务的软件代理(software agent)。有时候“聊天机器人”泛指虚拟助理,亦或专指网络聊天使用的软件机器人(有时候更专指娱乐而非实用的网络聊天)。但也可以指一种职业,或者企业组织,其乃是透过网络执行远端服务。
至2017年,随着新产品进入市场,虚拟助理的功能与运用正快速扩张。一项2017年5月的线上调查显示,美国的市占率依次为苹果 Siri(34%)、Google个人助理(19%)、Amazon Alexa(6%)及微软Cortana(4%)。搭载这些助理的智慧扬声器也有着巨大的变化;苹果直到2017年6月才宣布其智慧扬声器[1]。脸书的 M虚拟助理 预计2017年在 Facebook Messenger 上会有数亿的用量。 大量的智能手机用户安装了苹果和 Google的助理,微软则是在视窗的PC上 (Cortana 也可安装于手机和智慧扬声器);Amazon Alexa 则是首先具备线上订购的功能。
历史
最早具备数位语音识别功能的工具是 IBM Shoebox,在1962年西雅图世界博览会向民众发表。这个早年的电脑开发比IBM个人电脑早20年,能够识别16个字以及数字0到9。语音识别的下一个里程碑出现于1970年代的卡内基美隆大学,受到美国国防部及国防高等研究计划署(DARPA)大力支持。其工具“Harpy”能够驾驭约一千字——三岁儿童的字汇。大约十年后,同一个科研团队,利用隐马尔可夫模型开发了不但能分析单一的字而且是连串词的系统。 因此早期运用语言识别的虚拟助理是自动总机与医疗数位答录软件。 1990年代,数位语音识别技术成为微软、IBM、飞利浦等个人电脑厂商争取消费者的一个卖点。之后市场于1994年推出第一个智能手机IBM Simon,为我们现在认知的智能虚拟助理奠下基础。 第一个安装于智能手机上的现代数位虚拟助理是Siri——iPhone 4S 2011年10月4日引进的新功能。 苹果公司在2010并购Siri公司后开发Siri[2]。Siri公司是美国国防部及国防高等研究计划署出资成立的SRI International旗下的衍生公司。
互动方式
虚拟助理的作业媒介:
- 文字(网络聊天),尤其是即时通讯等的应用程序。
- 语音,例如 Amazon Echo上的Alexa 或是iPhone上的Siri 。
- 利用照相或上传图像,例如三星 Galaxy S8 上的 Bixby。
有些虚拟助理的使用方式多样,例如Google智能助理在Google Allo app 用文字,Google Home 智慧扬声器则用语音。
虚拟助理利用自然语言处理(NLP)从使用者的文字、语音输入,找到相应的可执行指令。许多助理利用人工智能的技巧,包括机器学习,不断学习。
用语音启动虚拟助理,可能需要用到“唤醒词”(wake word),这是一个或一组词,例如 Alexa 或者 OK Google。
视频
虚拟助理 相关视频
参考文献
- ↑ 要来了?苹果将于6月5日正式发布Siri智能音箱,环球网,2017-06-01
- ↑ 浅谈Siri,知乎专栏 , 2016-9-13