关注昆滇衣食住行 机器人小明“挥笔”上岗

2017-06-19 07:31:40来源:昆明信息港

    昆明信息港讯 “2013年至今昆明各大集市香蕉价格波动明显,最低3.75元/公斤,最高7.63元/公斤,总体价格呈下降趋势。”你能看出这句话是机器人写的吗?日前,云南首个写稿机器人公开测试,稿件内容涉及出行、天气预警、民生菜价、演出活动等。这款机器人取名“小明”,由昆明报业传媒集团昆明信息港互联网应用技术研究所自主研发。

小明发布的稿件

    从写作的稿件来看,“小明”在语言组织和逻辑处理方面都已具备记者的基本素质,甚至可以对一些事件进行分析,写作质量贴近人类水平。但总体来看,他还只是幼小阶段的机器人,写得稿件读起来比较生涩,没有人类写得那么通俗易懂。通过不断优化训练,“小明”会越来越智能,写出更多贴地气的文章。

    报道生成以秒速计

    “小明”并不是一个实体机器人,而是一套软件系统,是专门写稿的“大脑”。他整合了目前最先进的人工智能、大数据分析、自然语言处理等技术,聚合全网信息,通过融合领域知识,对数据进行深度分析,发掘重要的消息和事件,并用自然语言进行表达。简单地说,就是通过算法将所获取的数据嵌入系统,利用人工模板生成内容。

    数据采集加工、文章生成、文章分发,这就是目前“小明”的基本工作流程。其中文章生成包括人工模块规划和文章实现,解决稿件写什么、怎么写以及如何呈现等问题。目前写稿机器人可以对已有的文本素材进行语句筛选与融合,从而以秒速生成报道。如第一篇民生菜价服务信息,从数据自动抓取到报道发布,只需要一秒的时间。

    文章生成后将发布在昆明信息港AI媒体实验室、掌上春城和昆明报业传媒集团其他新媒体平台。同时由昆明信息港打造的智慧城市全网综合服务平台——我家昆明也会发布小明写稿的部分民生服务信息,都市时报也将不定期刊发相关稿件。近一个月,“小明”已累计写作、发布稿件1000多篇。

 机器人写稿流程示意图

    民生服务新闻是专长

    作为新入职的实习记者,“小明”重点关注的是昆明人的衣食住行。通过海量的数据和高效的算法,现在可以独立完成民生服务(停水停电通知、实时路况、天气预警、民生菜价等)、演出活动及部分行业的新闻稿件。

    “此前,写稿机器人大显身手的领域基本是体育和财经,因为这两个领域都涉及大量数据。从庞杂、枯燥的数据中寻找模式,就准确度和速度而言,机器人比人类更有优势。而民生新闻的生成对机器人来说略为复杂。因为主题较多,衣食住行样样都有,缺乏固定的模式,对机器写稿‘能力’是一种考验。”昆明信息港互联网技术研究所副所长欧阳欣介绍。

    写稿机器人和人类相比各有所长。机器人首先是速度快,可以在短时间内搜集大量数据和信息完成创作,其次是有特别强的数据分析、收集能力。但人类可以对一个事件进行演绎、联想,从更加丰富的层面上进行创作,表达自己的观点和立场,因而在深度撰写方面具有难以替代的优势。因此,写稿机器人是让记者从简单的、重复性的工作中解脱出来,从事更有深度、更有思想、更有人文关怀的新闻报道。

    未来将建AI媒体实验室

    据昆明信息港互联网技术研究所所长苏超介绍,“小明”写稿机器人二代开发已经有了基本蓝图, 即采用循环神经网络(RNN、LSTM)技术,模仿专业记者的行为,自动生成包括原因、结论、预测等内容的深度分析新闻。

    未来,昆港还将立足大数据和人工智能技术,打造AI媒体实验室,在机器人写稿、机器人推稿、新闻传播效果评估、数据可视化等方向上进行研究和实践,探索人工智能技术在传播上的应用。

    新闻助读:

    近几年,随着自然语言处理、大数据计算等人工智能技术的发展,国内外许多媒体已经开始了机器人报道的探索与实践。

    2014年3月,美国加州发生4.4级地震,《洛杉矶时报》成为当时最快在网站报道该消息的媒体,从撰写到发布仅用3分钟。该条新闻就出自机器人之手。 

    2014年7月,美联社(AP)与科技公司AutomatedInsights(简称AI)公司达成合作,使用他们的Wordsmith平台自动编发企业财报。

    《纽约时报》在财报季、运动比赛报道中用机器人写稿已成惯例,其机器人编辑Blossom blot每天推送300篇文章,受推荐文章的平均阅读量是未推荐文章的38倍。

    国内则以腾讯、今日头条和新华社为主要代表。多以财经、体育新闻为主,体裁上基本局限于快讯、短讯和财报。

    腾讯用得最早,2015年9月,腾讯财经用机器人Dreamwriter发布了一篇关于8月份CPI的稿件,题名为《8月CPI同比上涨2.0% 创12月新高》。

    新华社紧随其后,2015年11月18日,推出写稿机器人“快笔小新”。“快笔小新”操作简单快捷,输入一个股票代码,再点一点鼠标,就能产生一篇财报分析。

    2016年5月29日,四川绵阳发生地震,国家地震台网研发的智能机器人写下一条题为《绵阳安州发生4.3级地震》的新闻,这篇560字的稿件,从监测到地震到稿件发布仅花了6秒钟。

    今日头条则借用里约奥运这场东风,推出了自己的“xiaomingbot”,在数据库更新的两秒之内,即可生成新闻稿并发布。

    2017年两会期间,人民日报“小融”、新华社“i思”、广州日报“阿同”“阿乐”、南方都市报“小南”、光明日报“小明”、浙江广电“小聪”等纷纷参与两会报道,强大的人脸识别、智能语音、大数据搜集分析功能成为媒体展现新闻报道的新手段。

编辑:廖拓溪责任编辑:徐婷
昆明信息港官方微信