摘要:技术是推动媒体进步的动力,并引领传统媒体融合转型。在以数据为基石的大数据时代,随着人工智能和5G技术的不断成熟,将在媒体形态、内容创作、内容传播、内容监管等各个方面对媒体产生巨大影响,并为媒体行业带来全新的融合发展格局。本文主要阐述了人工智能技术在媒体行业的实际应用,并探讨了媒体行业人工智能的发展方向,力图构筑智能媒体生态圈。
关键词:大数据;人工智能;媒体行业;应用中图分类号:G2文献标识码:A
文章编号:1671-0134(2020)01-031-03DOI:10.19483/j.cnki.11-4653/n.2020.01.005
本文著錄格式:任鼎.大数据时代新闻媒体的智能发展之路[J].中国传媒科技,2020,01(01):31-33.
导语
媒体格局、舆论生态和传播形态经历深刻变革,媒体行业正处于融合发展的战略转型期。在此大环境下,探索媒体产业升级的新方向,从而实现可持续发展成为媒体行业工作者的重要任务。随着云计算(计算能力)、大数据和人工智能算法的日渐成熟,人工智能进入新的爆发期,大数据和人工智能在媒体行业的实际应用成果使媒体工作者逐渐意识到数据是媒体融合转型发展的基石,人工智能将成为推动媒体进一步融合发展和体现媒体竞争力的关键核心技术。可以预见的是,媒体行业必将伴随人工智能的发展实现革命性突破,开辟崭新的数据驱动业务的智能媒体时代,引领媒体融合的未来。
1.人工智能技术发展及在媒体行业应用
人工智能是一个融合计算机科学、统计学、脑神经学和社会科学的前沿综合学科,可以使计算机在某方面代替人类实现识别、认知,分析和决策。人工智能与大数据是一套完整的技术体系,涵盖了数据采集、数据挖掘、自然语言处理、计算机视觉处理、语音处理、神经网络、深度学习、机器学习等一系列的相关技术与理论,并具备对海量数据进行统一采集、处理、存储、检索以及深度智能挖掘分析的能力。
人工智能落地应用需要满足极大的条件,比如充足的数据、一定的规律及确定性。因此人工智能在媒体行业的应用场景主要集中于自然语言处理、计算机视觉处理、智能语音处理、知识图谱等方面,通过与内容生产(语音识别、智能翻译、AI自动写稿、AI视频自动生成、AI虚拟主持人等)、内容审核(内容风险智能识别、视频多模态标签识别)、内容分发(内容标签、用户画像、智能推荐、智能问答、智能检索、广告智能分发)等实际业务生产环节深度融合,推动媒体运作流程中每个环节的变革,为媒体向智能化发展赋能。
1.1自然语言处理
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,是实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理的内容包括:关键词提取、摘要生成、分词、实体识别、主题分类、情感分析、议题提取、事件提取、言论观点提取、关系抽取等,并且整体的实现方法从词典规则匹配、统计学概率计算的方法,转变为当前主流的机器学习、深度学习的智能分析算法。
在新闻稿件入库存储过程中,结合新闻要素和特性构建知识标签体系,利用自然语言处理技术与计算机视觉处理技术对图文音视频数据进行初步处理,实现新闻自动分类和自动打印,深度挖掘数据加工价值,并通过智能检索功能帮助用户快速定位想要的新闻内容,以提高数据存储和检索的高效性与准确性。
1.2计算机视觉处理
传统报业以图文稿件为主,随着移动互联网和5G技术的发展,长视频、短视频、直播、AR等特色产品成为融媒报道新手段,媒体呈现出资讯视频化、直播常态化的特点,图片、音视频数据越来越成为媒体单位重点需要挖掘分析的对象,因此计算机视觉处理成为目前行业内重点突破的方向。
计算机视觉处理涵盖实现人脸识别、物体识别、场景识别和动作识别等图片内容分析的能力,基于深度学习进行大规模的数据训练,对图片、视频进行文字、人脸、物体、场景等多维度分析,自动分类并智能识别相关内容,输出结构化的标签体系,同时可自动截取关键帧及精彩片段。
计算机视觉处理在媒体中的应用已经逐渐成熟,包括内容智能标签体系、内容智能审核等。以媒体内容监测为例,人工智能使得非结构化媒体数据特别是图片、音视频数据采用机器审核成为可能,通过数据集的训练建立智能审核模型,针对敏感元素进行追踪,精准高效识别文字、图像及视频中涉政、色情、辱骂、违禁、垃圾广告等违规内容,并进行标注和报警,便于后续过滤和处理,人工智能技术的使用减少了人力投入,防御了内容风险。
1.3语音处理
语音处理主要包括语音识别和语音合成,语音识别是通过大规模的训练,将音频信息转化为机器可以识别和处理的文本信息,语音合成通过大规模的数据训练使机器能够仿真发声。
语音处理可以运用于素材采集环节和采编环节,基于语音转写技术,快速实现音视频转化成文稿进行二次编辑,提高编辑人员原本整理语音稿件的工作效率。
1.4知识图谱
知识图谱的基础是自然语言处理技术和知识深度推理技术,本质是结构化的语义知识库,是一种由节点和边组成的图数据结。不同实体通过关系相互联结,构建关联关系形成网状的知识结构,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关“属性—值”。构建知识图谱的目的是获取大量有关联的、计算机可以理解的知识结构,并使计算机具备了从“关系”的角度去分析问题的能力。其典型应用便是智能搜索引擎、智能问答等。
2.人工智能推动媒体智能化发展
在数据驱动业务的智能媒体时代,面对快速变化的技术形势,媒体单位在智能化建设方面需要构建自身以大数据和人工智能为核心的技术生态体系,基于媒体的数据打造具有针对性的人工智能系统,提升媒体业务应用与人工智能融合度,并打造符合自身未来发展的建设模式。
同时媒体单位更要意识到人工智能距离接近人类学习、思考还有很遥远的距离,因此人工智能目前最好的应用方向是以媒体生产环境作为突破口,帮助媒体实现内容升级和用户体验升级。
2.1人工智能推动生产方式变革
人工智能技术推动机器自动生产新闻,改变了新闻生产方式,采取人机合作的方式实现了新闻瞬时反应、快速生成,解放新闻工作者。这种编辑方式相较于人工写稿具有高时效性和真实客观性的优势,大大降低了部分新闻领域的人力投入,并将解放的人力投入优质原创内容创作中,实现整体创作氛围的良性循环。机器人写稿就是通过人工智能技术将大数据采集的新闻数据进行分析加工,并把加工好的媒资数据和各类内容模板组件,自动灌入智能生产引擎,通过机器自动生产内容,实现新闻的快速编辑生产,这个生产过程尽量减少人的干预。
2.2人工智能重塑新闻生产智能化流程
人工智能以技术力量驱动生产业务变革,为选题策划、素材采集、内容编辑、审核发布、绩效考核和运营管理等环节提供智能化服务。优化存储、简化编辑、全面提升工作效率。在前期的选题策划中,大数据技术可以从海量内容中筛选出大众关注的热点和线索,并快速精准地确定选题。
在内容生产环节中,基于语音转写技术,快速实现音视频转化成文稿进行二次编辑。在图文稿件生产过程中,人工智能技术可根据新闻产品的主题要求,自动适配相关的文字和图片资料,形成相应的图文专题库,辅助新闻生产,并可根据编写的稿件内容自动推荐库中相关度最高的新闻素材供采编人员浏览,帮助编辑人员快速定位到有价值的信息。在视频稿件生产过程中,可通过数据算法快速智能化剪辑并生成智能字幕,再经过专业人士的加工和完善形成完整的成品,也可基于文字稿件和采集的多媒体素材,经过视频编辑、语音合成、数据可视化等一系列过程,最终生成一条富媒体新闻,辅助新闻生产。
在新闻的内容审核环节,可以对文字、图片、音视频进行基于人工智能的内容审核,精准识别涉政、涉黄、涉暴、涉恐和敏感人物等信息,有效管控业务违规风险。
在新闻的分发环节中,人工智能技术可以通过深度学习算法,精准掌握用户的浏览习惯和偏好,进行个性化的内容推荐,实现千人千面。在新闻的传播环节中,运用人工智能技术可对信息真实性进行核查,有效防范可控制假新闻的传播。
2.3構建人工智能中台
太极计算机股份有限公司深耕媒体行业20年,长期服务于中央、区域、行业媒体及大型政企单位,作为我国媒体融合进程的有力推动者,见证并参与了媒体行业的技术发展及产业转型,我们深刻地理解技术给媒体带来的巨大影响。媒体单位只有拥抱人工智能等新技术,持续赋能媒体应用,创新新闻创作、发布形式,方能引领媒体融合的未来。
媒体单位以底层大数据平台和智能服务的基础设施平台为支撑打造人工智能中台,将业务应用所需的底层算法模型下沉至中台,以达到复用、组合创新、规模化构建智能服务的目的。同时发挥媒体的优势联合行业内顶尖的技术公司打造智能生态体系,在为上层应用提供技术支撑的前提下打造前瞻性的创新应用,赋能媒体产业升级,打造智慧媒体。
结语
本文详细介绍了人工智能的主要技术方向,随着人工智能技术的成熟和发展,人工智能已经深入新闻媒体内容制作传播的整个流程,从新闻选题、内容采集、新闻生产及分发,每个环节都有人工智能的助力,极大提升了编辑工作效率,解放了编辑劳动力,帮助创意新闻的生产。
人工智能仅仅只是开始,未来,随着5G正式投入运营,物联网和边缘计算技术将得到长足的发展。媒体与物联网结合,打造多元化的人机交互智能体验,构建万物皆媒的媒体生态。同时,更需警惕人工智能对人类的影响。以智能推荐为例,人工智能建立了一个强化人类学习的闭环,基于手机用户的使用行为及状态进行内容推荐,在过程中通过强化用户接收到的信息来潜移默化影响用户的观点和行为。算法的背后是人,算法的价值观就是人的价值观,算法的缺陷是价值观的缺陷,因此媒体需要强化正确价值观主导下的技术驱动,赋予新型主流媒体媒体的正确方向,为人工智能在行业的发展奠定良好的基础。
作者简介:任鼎,男,汉族,安徽省宿州市,太极计算机股份有限公司文旅战略业务本部业务发展中心总经理,研究方向:媒体行业的智能化融合发展研究。