近期,xiaomingbot已完成最新一轮升级,除体育新闻,xiaomingbot在今日头条上撰写的文章现已涵盖科技、财经、房产等十几个分类,并且对多个领域的每日热点做持续的跟踪报道。
近日,今日头条人工智能实验室与北京大学联合研发的写稿机器人xiaomingbot获得了吴文俊人工智能科学技术奖。这个奖项以吴文俊院士命名,被外界誉为“中国智能科学科技最高奖”,据说代表中国人工智能学界的重大突破与最高荣誉。
吴文俊先生是我国著名数学家、中国科学院院士。他在纯数学和应用数学的多个领域都作出了杰出贡献。前半生中,他用30多年时间,在代数拓扑学的研究领域取得了一系列奠基性成就,其中最著名的便是“吴公式”的建立;上世纪50年代初,吴文俊先生放弃了国外优越的研究条件,毅然回国。他的这份情怀,影响着无数后来者。
花甲之年,吴文俊老先生毅然转身,开创与拓扑学毫不相关的数学机械化研究领域,开创了里程碑式的“吴方法”。耄耋之年,他仍在密切关注新的科研进展和新涌现的人才。他曾一再表示:“中国的人工智能不能走外国人的老路,要在原创科学和基础理论研究方面实现突破。
今日头条是今年“吴文俊奖”获奖项目中唯一以企业载体获得专业类奖项的机构,过去这一通常只授予顶尖高校、重点实验室和科研机构。
此次获奖的写稿机器人xiaomingbot早在2016年6月就已经在今日头条上线。里约奥运会期间,通过对接奥组委的数据库信息,xiaomingbot曾写过200余篇赛事报道,包括乒乓球、网球、羽毛球和女足等比赛,累计获得200万用户阅读。它撰写的文章可以涵盖比赛时间、实时比分、运动员信息等主要新闻要素,可读性与职业记者相差无几。
奥运会上线时,xiaomingbot与其他机器人相比就有明显优势。根据人民网研究院的报道,比起美联社的WordSmith、华盛顿邮报的Heliograf、第一财经的DT稿王等,今日头条写稿机器人xiaomingbot实现了很多黑科技。比如:
一、写稿速度更快——2秒内完成稿件并上传至媒体发布
xiaomingbot的撰写发布速度几乎与电视直播同步,从数据库对接、信息搜集、文本生成、润色完成报道,最后发布、推送到今日头条手机客户端,只需用时两秒。
二、拟人化程度更高——并非千篇一律
根据比赛选手的排名、赛前预测与实际赛果的差异、比分悬殊程度等情况,xiaomingbot可以自动调整生成新闻的语气,并使用感情色彩的词语,如「实力不俗」、「笑到了最后」等。
三、发布稿件类型多样——短讯及长文章
xiaomingbot不仅可以发布赛事消息的短讯,还可以生成整场比赛的赛事简报类长文章。
四、图片识别筛选——可实现自动上传图片功能
xiaomingbot可以通过语言理解与图像识别,在数据库中自动选取并在文章中插入赛事图片,让稿件图文并茂更加生动形象。
奥运会后xiaomingbot还在持续撰写NBA、CBA、中超、意甲等体育赛事的文章,包括很多场诸如“亚迪拉-席尔瓦4:0赫巴-阿勒吉 不费吹灰之力经济奥运会乒乓球女单下一轮”这样的冷门比赛,xiaomingbot也均有报道。根据今日头条统计,xiaomingbot文章的阅读率与人类创作者基本持平。
近期,xiaomingbot已完成最新一轮升级,除体育新闻,xiaomingbot在今日头条上撰写的文章现已涵盖科技、财经、房产等十几个分类,并且对多个领域的每日热点做持续的跟踪报道。据悉,xiaomingbot已与光明网、《财经》杂志、大河报等主流媒体达成战略合作,向其进行优质内容输出。
对机器写稿而言,它的核心技术是自然语言理解,同时会涉及机器学习、数据挖掘、深度学习、知识图谱等多项技术。自然语言处理是人工智能领域难度最大的课题之一。相对于语音和视觉来说,语言是高度抽象化的表现。一方面,人类语言具有复杂性,同一句话可能代表不同含义。另一方面,正确理解人类语言还要有足够的背景知识,比如对成语和歇后语的理解。这些都是自然语言理解进一步发展需要克服的难题。
因此很多人所忧虑的机器是否会取代记者,短时间内来看是很难的。正如今日头条李磊所言,“我们做新闻机器人的目的并不是取代新闻记者,而是帮助记者创作出更高质量的内容。”