北京新增5例新型冠状病毒感染的肺炎病例已确诊10例

我市新增5例新型冠状病毒感染的肺炎病例

我市丰台区37岁男性患者,于1月10日赴武汉出差,1月11日返回北京,1月14日出现发热症状,1月20日在我市医疗机构就诊;海淀区39岁男性患者,于1月3日赴武汉出差,1月4日返京,1月9日出现发热症状,1月14日在我市医疗机构就诊;西城区56岁男性患者,于1月8日赴武汉出差,1月16日返京,当日出现发热和呼吸道症状,1月20日在我市医疗机构就诊;通州区18岁女性患者,1月12日赴武汉学习,1月17日返京,1月19日出现发热和呼吸道症状,1月20日在我市医疗机构就诊;海淀区32岁女性患者,于1月13日赴武汉旅游,1月17日返京,在武汉期间已出现呼吸道症状,1月20日在我市医疗机构就诊。根据临床症状和流行病学调查,经疾病预防控制中心检测、专家组评估,以上5名患者今日确诊为新型冠状病毒感染的肺炎病例。5名患者病情平稳,在定点医院接受隔离治疗。现已对21名密切接触者开展医学观察,目前无发热等异常情况。

实际上,训练 Meena 正是为了最大程度地减少困惑度,以及预测下一个标记(雷锋网注:指对话中的下一个单词)的不确定性——据博客称,这是因为 Meena 的核心为 Evolved Transformer seq2seq 架构,即一种通过进化神经架构搜索发现的 Transformer 体系结构,能够改善困惑度。

近年来,随着越来越多的 AI 聊天解决方案进入生活,我们需要关注最有价值的东西——定义类似人类的对话,并探究这类对话在聊天机器人领域中的角色。

雷锋网(公众号:雷锋网)了解到,Google 从公共领域社交媒体对话上过滤得到了 341GB 的文本,并以树状脉络形式组织文本进行「多轮对话」训练。研究者将每轮对话作为训练样本,同时每轮之前的 7 轮对话为语境信息,共同构成一组数据。据悉,选择 7 轮对话作为语境,既能保证训练过程获得足够长的语境信息,同时模型也能不超过内存限制。毕竟文本越长,占用的内存也越多。

Meena 让我们更接近目标,但尚未让我们达到目标。

不难看出,Meena 相比于现有的 SOTA 聊天机器人,有着更高的 SSA 分数,甚至接近于人类的表现。

北京市卫生健康委员会

困惑度与 SSA 强相关

《通告》要求,任何单位和个人,应当服从当地人民政府发布的防控疫情的决定、命令,自觉接受当地政府及疾病预防控制机构、医疗机构等部门采取的有关登记调查、检验、采集样本、隔离观察、隔离治疗等防控措施,主动如实报告病情、旅居史、密切接触人员等相关情况,不得迟报、漏报、瞒报、谎报。

《通告》称,拒绝接受检疫、强制隔离或者治疗,造成传染病传播,情节严重,危害公共安全的,依法给予治安处罚;构成犯罪的,依法按照以危险方法危害公共安全罪追究刑事责任。

值得一提的是,开放领域聊天机器人更符合人们心中对「人工智能」的定位,开发难度自然也很大——当前开放领域聊天机器人面临的一个严峻问题在于它们表达的内容往往没有意义,无法与用户的问题连贯起来,而且由于缺乏基本的常识和认知,不能给出针对性的回复。

根据博客,上述这些表现是由 Google 根据新提出的人类评价指标「Sensibleness and Specificity Average (SSA)」得出的,而此次提出新的指标是因为,目前聊天机器人的人类评价指标颇为复杂,而且也很难形成一致的评价指标。Google 表示,SSA 能捕获基本的、但对人类对话来说很重要的属性。

截至1月21日18时,我市共确诊10例新型冠状病毒感染的肺炎病例,其中西城区1例、海淀区2例、丰台区1例、通州区1例、大兴区2例、昌平区2例,武汉来京人员1例。

开放领域聊天机器人开发难度大

研究人员发现,超参数调整后,实现高质量对话的关键在于性能更强的解码器。

开放领域聊天机器人的研究不仅具有学术价值,还可激发很多有趣的应用,如更深层次的人机交互、提升外语训练效果,以及制作交互式电影和游戏角色。

据记者了解,疫情发生以来,海南已处理多起违反疫情防控相关规定的案件。如,海南东方市一名患者在确诊新冠肺炎之前,刻意隐瞒接触史,被警方刑事立案侦查;一外省女子在海南环岛高铁昌江棋子湾站拒不配合防疫工作,辱骂并向工作人员、民警吐口水,被警方行政拘留10日等。(完)

26 亿参数的端到端神经对话模型

另外,在实用性方面,诚然 Meena 作为一款开放领域聊天机器人,能够实现多轮对话。不过 Meena 并不能协助用户完成某项任务、学习某项新技能,或为身处困境的用户给予情感或心理支持,和用户的聊天没有明确的目的。而耗费时间进行无意义的交谈,在我们所处的时代大背景下似乎并非理想产品。

其中,任务导向型主要有问答系统、对话系统聊天机器人,分别指基于用户的问题给出一个回答(常用于智能搜索、智能家居中的家电控制等场景)和与用户进行多轮对话的聊天机器人(如客服机器人,销售机器人等)。

为计算这一指标,研究者测试了 Meena、Mitsuku、Cleverbot、DialoGPT 及小冰等常见的聊天机器人。在测试中,对于每一款聊天机器人,研究者都在 100 个对话中收集了 1600 到 2400 轮,各聊天机器人的回复都由人类评价者评分(主要依据对话的流畅性和回答的准确性),其各自性能表现如下图。

根据使用场景划分,聊天机器人(chatbot)主要有开放域型(Open-Domain)和任务导向型(Task-Oriented)两种。

雷锋网了解到,困惑度(perplexity,指一种任何神经会话模型都能轻易获得的计算指标)是 seq2seq 模型(雷锋网注:一种循环神经网络的变种,包括编码器和解码器两部分,是自然语言处理中的一种重要模型,可用于机器翻译、对话系统、自动文摘)中的一个常见指标,用于评价语言模型的不确定性。

根据《通告》,患有或者疑似患有新型冠状病毒感染的肺炎,隐瞒、谎报病情、旅居史、密切接触人员等信息,或者违反隔离、治疗相关规定,出入公共场所,参与人员聚集活动,故意传播新型冠状病毒或造成病毒传播危险,危害公共安全的,依法给予治安处罚;构成犯罪的,依法按照以危险方法危害公共安全罪追究刑事责任。

而 Google 开发的 Meena 正是一款开放领域聊天机器人,那么相比现有的聊天机器人,究竟有何突破?

首先我们要意识到,即便 Google 开源所有代码,也很少有人能培训类似 Meena 的模型。Meena 应该还在实验室里,操作起来也非常复杂,还不能将其整合到一个工具中,而且 Google 也不可能很快就将其作为一项服务向用户提供。因此,恐怕短期内 Meena 难以推出。

《通告》要求, 截至2月9日18时前,尚未登记报告的重点人员必须主动向当地政府或疫情防控部门登记报告。在规定期限内拒不履行登记报告义务造成其他严重后果的,司法机关将依法从严惩处,并纳入征信体系进行多部门管理和惩戒。对暴力伤医、制假售假、非法经营、造谣传谣等破坏疫情防控的违法犯罪行为,依法严厉打击,从重从快追究法律责任。

毫无疑问,人类评价或多或少存在一些问题,因此很多研究者都希望找到一个能够自动计算的评价指标,而且这个指标要能和人类评价准确对应。

在博客中 Google 表示,研究者依据层数、注意力数量、训练步数、编码器、训练方式等因素,共测试了 8 种不同的模型,发现困惑度越低,SSA 分数越高,同时两者的相关系数很高(R^2 = 0.93)。

根据博客中展示的数据,我们相信 Meena 的确性能出众,不过 Meena 究竟什么时候能推出、真正推出后表现如何,可能都要打问号。博客中提到,目前研究团队正在就这一研究的风险及益处做进一步的评估,并可能在未来几个月内推出 Meena,旨在推动该领域的发展。

与此同时,记者 Ronald Ashri 也对 Meena 提出了进一步质疑。正如上文所述,Google 从公共领域社交媒体对话上过滤得到了 341GB 的文本,以此进行进一步的训练。那么,数百万的公共领域社交媒体对话会是这一所谓的「史上最强聊天机器人」的正确数据集吗?Meena 是否会讲出不恰当的话,可能也是一个我们要关注的点。

而开放领域聊天机器人(也称闲聊式机器人)顾名思义针对开放域的对话场景,主题、内容不限,比如微软小冰和苹果 Siri。Google 在上述博客中表示:

而值得一提的是,Google 证明了困惑度与 SSA 高度相关。

Google 在博客中介绍称,Meena 是个 26 亿参数的端到端训练的神经会话模型,是 GPT-2 模型最大版本(15 亿参数)的 1.7 倍。据称,Google 利用 400 亿字的数据集,通过 2048 个张量处理单元(即 Tensor Processing Unit,Google 专用 AI 芯片)训练了 30 天,得到了最佳版本。实验表明,比起聊天机器人 SOTA,Meena 能更好地完成对话,内容也更具体、清楚。

雷锋网原创文章,。详情见转载须知。

《通告》规定,拒绝执行卫生防疫机构依照传染病防治法提出的预防、控制措施,引起新型冠状病毒感染的肺炎传播或者有传播严重危险的,依法给予治安处罚;构成犯罪的,依法按照妨害传染病防治罪追究刑事责任。

实际上,设计智能聊天机器人是为了应对信息爆炸时代存在的信息过载问题。最初,人们把聊天机器人当作搜索引擎的终极形态进行设计和开发。不同于现有的搜索引擎,聊天机器人可针对用户的问题自然又通顺地给出精准的答案,节约了很多时间,从而带来更好的用户体验。

研究者将继续通过改进算法、架构、数据和计算量等,降低这一神经会话模型的困惑度。

新提出的人类评价指标 SSA