【摘要】以南方报业传媒集团“数据优先”战略为指导,南方舆情积极推进集团互联网数据中台项目建设。数据中台在舆情数据采集、应用的基础之上,实现数据本地化、服务本地化。通过技术支撑和数据赋能,数据中台为南方舆情业务带来可持续发展的动力,也正逐步整合集团互联网数据出入口,以数据融合推动集团媒体业务融合转型升级。
【关键词】互联网数据中台 舆情技术 媒体融合
南方舆情创办于2014年,是南方报业传媒集团媒体融合转型示范项目之一互联网数据可视化,也是集团培育新型南方品牌的一个重要着力点。以集团“数据优先”战略为指导,南方舆情积极推进集团互联网数据中台项目建设,搭建以数据为驱动的智慧服务体系,积极探索媒体业务融合转型与创新之路。该项目于2022年成功实施上线,将技术、业务和数据沉淀于中台,提升响应、支撑舆情一线业务和产品需求的时效性、针对性,并为集团各媒体业务开发多形态数据产品、形成数据生产服务新模式、做大做强集团数据资产,提供互联网大数据技术支撑。南方舆情技术平台从南方舆情创办之初即坚持“造船”和“借船”并举,到创新技术产品服务实现反哺,以及围绕互联网数据中台构造舆情技术生态,其发展过程中呈现出来的规律、操作办法、探索经验,对主流媒体融合转型的技术转型路径具备很强的参考价值。
一、科学规划、分步推进舆情技术平台建设
南方舆情是国内首家从专业媒体角度专注“治理现代化”研究领域的复合型智库,当前已成为探索广东治理现代化路径的首席舆情服务平台。南方舆情业务的发展壮大与技术平台的强力支撑密不可分,可以说其技术平台的发展过程,就是主流媒体谋求转型发展在技术方面探索过程的缩影。从创办至今,南方舆情技术平台经历了三个阶段:
(一)第一阶段:高度协同内外资源,快速搭建舆情技术体系。南方舆情创办之初,从顶层设计开始就采用了高度协同的建设策略,充分联动内外部资源协同推进“内容一体化生产”“技术一体化支撑”“经营一体化统筹”。此阶段舆情技术平台建设坚持内外协同,坚持“造船”和“借船”并举,在通用性程度较高的舆情数据平台上与第三方数据服务平台合作,在个性化要求较高的生产服务平台上则主要采用自主研发,搭建覆盖全网的舆情数据平台与生产服务平台,推动整个技术体系的快速形成。快速搭建而成的技术平台支持实时监测数千万个目标数据信源,年均生产舆情分析报告产品3000多篇,支撑舆情业务快速开展走上正轨。南方舆情创办首年即实现盈利,南方舆情技术发展也得到业界的高度认可,与集团信息技术部协同建设的“南方报业全媒体资源库和舆情智库项目”于2017年获得传媒界技术最高奖项——“王选新闻科学技术奖”一等奖。
(二)第二阶段:探索技术产品和服务创新,数据赋能反哺业务。随着舆情业务的进一步发展,为应对日益复杂的用户需求与舆情服务场景,南方舆情着手实施技术产品和服务创新升级。此阶段舆情技术平台建设以“更高效、更全面、更快速、更灵活”为目标,一方面积极探索新型舆情产品和服务,建设广东舆情研判中心、多维交叉比对系统、舆堂APP等多项产品,对内优化舆情生产流程提升生产效能,对外完善舆情智库服务链条;另一方面打通互联网数据流转通道,借助第三方互联网开放平台先后研发自动简报、自动预警、舆情案例库、舆情选题库、榜单等产品服务,形成自主可控的技术快速迭代能力。同时,技术升级形成的数据分发与数据分析能力开始反哺集团其他业务的开展,赋能主流媒体传播力建设:一是助力集团媒体智库矩阵建设,年均向其他业务单元推送互联网数据1000万条以上;二是协同采编业务开展,为新闻报道、内参生产提供数据分析、数据可视化支撑,提升内容创新能力;三是协同集团内容风控管理,应用数据监测和预警等功能提高主流媒体内容风控管理效率。
(三)第三阶段:打造互联网数据中台,初步构建舆情技术生态。在南方舆情创建和初步发展阶段,舆情数据平台一直采用与第三方数据服务平台合作的方式。为支撑做大做强舆情业务,必须对技术进行长远规划,将关键数据和平台抓在自己手里。因此,舆情技术平台再一次升级,启动互联网数据中台的建设。此阶段的舆情技术平台建设引入中台理念,搭建“大中台、小前台”技术架构。数据中台在舆情数据采集、应用的基础之上,实现数据本地化、服务本地化,整合集团互联网数据出入口,优化集团互联网数据要素供给机制。同时,南方舆情以数据中台的建设为契机,加快构建技术生态,对接多家数据服务厂商,集各家所长为“我”所用,提升数据获取能力,提高系统灵活性,实现更加快速的技术迭代与产品服务更新。
二、互联网数据中台建设内容
为贯彻落实中央关于媒体融合发展的战略要求,积极应对互联网、移动互联网对媒体行业传播模式和用户需求的改变,储备生产、传播平台的数字化转型所需的大数据基础设施、数据和技术资源,发挥数据生产要素在媒体融合转型过程中的重要作用,南方舆情与集团信息技术部协同共建南方报业互联网数据中台,打造融合媒体发展的互联网大数据资源基础应用平台,其建设内容主要为以下四个方面:
(一)数据汇聚联通,打造集团互联网数据中心。在集团中央数据库建设的基础上,打造集团互联网数据中心,接入多渠道、多类型数据信源,为包括舆情在内的集团各业务部门提供便捷、高效、完整的互联网数据响应能力。中台定义了数据接入标准,从数据类型、数据字段、数据获取等方面对数据标准进行了详细定义,从而实现兼容多数据厂商、多信源的数据接入,并存储至本地的数据中心,摆脱以往对单一数据厂商数据源的依赖。各数据服务厂商以云服务的方式提供各类数据,包括:新闻、网站、论坛、博客、报刊、客户端、微博、微信公众号、境外媒体网站、视频(含短视频)、电视台、评论数据等十余种。对于微博、微信公众号、客户端等时效性要求较高的信源采集频率高于1次/5分钟,特殊情况下时效要求还可进一步提高。数据中心在灵活接入多信源的同时,在本地保持数据格式的一致性。数据中心的建设,极大地提高数据获取的主动性,有利于把握数据优势,提升数据服务能力。
(二)萃取数据价值,建设集团互联网数据资产。为让数据对于用户“可见、可懂、可用”,需对汇聚的海量数据进行结构化、标签化,以供用户快速检索和分析挖掘,进一步萃取和盘活数据资产价值。为降低数据获取和分析成本,避免大量无效数据本地化,在数据接入流程中,将图片OCR、语音转译、视频关键帧文本识别等重资产数据处理能力前置在云端处理互联网数据可视化,并提前设置应用数据过滤条件,通过定义信源地域、信源级别、信源类型、信源标签、文本标签、情感类别等属性,从多个维度配置数据接口,通过技术手段提前预测资产数据样本,提高样本数据匹配准确度,再按需接入并本地化,提升本地应用获取数据效率。通过科学分析和规划,中台内本地化的互联网数据资产可支持大部分的舆情业务和媒体业务应用。
(三)落地数据应用,建设舆情服务和媒体数据服务体系。在数据中心基础之上,中台建立关键词解析体系、数据信源标签化、数据检索、数据分析、数据可视化、组织架构管理、系统管理等基础服务模块。基于这些基础服务模块,搭建本地化的舆情服务系统,建设舆情监测、视频监测、舆情预警、分析研判、跨模态检索、以图搜图、主题发现、热搜监测、报告生产等功能应用,实现对舆情业务的全面支撑。在媒体数据服务侧,中台也同步建设了内容风控、新媒体运营、采编线索发现、传播效果评估等功能应用,推动舆情业务与主流媒体传播力建设的相融共进。
(四)数据和服务能力开放共享,初步形成舆情技术生态。发挥舆情业务数据优势,中台通过内部协同、项目合作等方式推动互联网数据共享与接口开放。一方面中台以统一标准接口配置接入多个数据服务厂商信源,并逐步接入数据智能化能力,整合上游服务提供商;另一方面根据舆情业务和各类新媒体业务需求,中台提供接口输出互联网数据和数据分析能力,同时中台还具备“多租户”能力,可将舆情应用和媒体数据应用以云服务的方式提供给用户。
三、互联网数据中台建设成效与价值
(一)沉淀数据资产,繁荣数据服务生态,形成数据价值闭环。舆情业务全流程数据沉淀于中台,通过平台能力和业务对数据的不断滋养,形成了一套高效可靠的数据资产体系,其中全国重点网站数据、报纸数据、微博微信数据、新闻客户端数据、评论数据等,与集团各单位媒体融合转型业务发展所需的数据资产有较高的重合度,可基于中台进行高效输出。在数据资产体系之上,中台又打造了多项通用的互联网数据基础服务,集团内外用户可在此基础上快速实现个性化数据应用定制和创新,从而降低数据服务的门槛,繁荣服务生态,让数据“越用越多”“越用越智能”,形成数据价值闭环。
(二)降本增效,协助业务突破发展瓶颈。互联网数据中台的建设,有助于南方舆情突破目前遇到的业务瓶颈,提升核心竞争力,赢得更广泛的市场:一是降低数据服务成本与销售成本,提升经济效益;二是对接各家数据服务厂商优势信源,形成自己的数据优势,进而扩大产品优势;三是数据系统本地化,有助于增强舆情技术自主性,加速个性化定制开发,实现产品服务快速更新迭代;四是有助于舆情生产流程的优化再造,打造更适合舆情分析师的舆情生产服务平台,提高舆情生产效率;五是有助于沉淀用户服务数据,夯实用户服务基础,提高用户服务黏性。
(三)积累技术成果,为舆情业务打造护城河。在舆情技术平台不断升级的过程中,南方舆情也不断积累技术研发成果,丰富舆情技术知识产权体系。当前南方舆情已
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。