“舆情”的概念自2010年前后在国内出现并有零星实际服务落地以来,由不为人知到全民皆晓,舆情的应用范畴由政务领域逐步扩展至企业服务、个人服务、行业研究等领域,而舆情监测软件作为舆情服务的“基础设施”,随着整个舆情行业的发展也经历了多轮变革与迭代。
一款优秀的舆情软件,可以为品牌方在消费者洞察、客诉信息收集、宣传效果评估、竞品分析、危机管理等方面提供强有力的支撑。如何准确评估一款舆情软件的优劣?如何从众多良莠不齐的供应商中挑选出有强大技术实力背书的舆情软件厂家?我们建议通过以下六点进行比对:
号称“全网采集”,系统是否真的具备全网抓取能力?
能否实现大规模定向采集 + 自建搜索引擎?
◆ Web1.0、2.0时代:舆情软件百家争鸣
◆ 自媒体、短视频相继崛起,信息孤岛效应凸显,舆情产品出现分层
◆ 数据获取方式全新升级:由关键词采集转为定向采集,由向通用搜索引擎索要数据转为自建内部搜索引擎
◆ 能实现大规模定向采集+自建搜索引擎的舆情软件厂家寥寥无几
◆ 目前市面上绝大多数舆情服务商不具备技术开发能力
◆ 鉴别“全网采集”真伪:比对数据量和超级APP数据、命题采集
在web1.0及web2.0时代,舆情信息主要来自于新闻站点、博客、微博等较为有限的信源,除微博信息外,大部分数据均可通过百度、搜狗这类通用搜索引擎获取,这一时期也是舆情系统百家争鸣的时期,舆情软件获取数据的主要方式是目标导向式采集,即以关键词搜索的形式,从百度及微博等平台抓取数据。
随着以微信、今日头条为代表的自媒体平台崛起,互联网进入自媒体时代,由于各个自媒体平台对搜索进行了限制,通过关键词搜索的形式难以在自媒体平台获取到全面、准确的自媒体数据。
同时,由于主流平台(微信、头条等)限制百度等搜索引擎对其数据进行抓取,抖音、快手及视频号等短视频平台的崛起进一步加剧了这种信息孤岛效应,大量的信息被隔离在一个又一个独立的超级app内,彼此无法互通,搜索引擎的信息获取效率大打折扣。
信息获取难度的不断提高造成了舆情产品的分层,大部分技术迭代能力较差的舆情产品依旧采用以引擎搜索为主的方式获取数据,其数据全面性、时效性均无法满足自媒体时代下舆情监测的需要,逐步落伍。小部分技术能力较强的厂商则进入到以定向采集数据为主,关键词搜索采集为辅,自建内部搜索引擎的新阶段。
以往关键词采集是目标导向式采集,如采集“某为”相关的信息需要以“某为”为关键词在百度等搜索引擎搜索并获取数据,采集过程中并无其他与“某为”不相关数据进入系统。
定向采集则是以最大限度获取各个平台、站点数据为指导思想,如针对某个门户网站,通过大规模爬虫实时高速采集整个站点全部板块数据,针对某个自媒体平台,实时采集整个app内有采集价值的数百万自媒体订阅号,采集过程中不对数据进行区分,统一放入内部自建的搜索引擎中。在这种情形下,如需获取“某为”相关的数据,则直接向内部搜索引擎请求数据。通过这种信息采集和搜索方式可以有效解决信息孤岛及信息获取时效性的问题。
大规模定向采集+自建搜索引擎的技术架构优势明显,缺点在于技术难度较大,维护成本较高,目前整个市场上成熟采用这种技术架构的厂商,包括艾普思在内,不过寥寥几家,我们可以称之为舆情软件厂家。
目前市面上的舆情服务商绝大部分并不具备技术开发能力,其中包括一部分将舆情服务作为唯一或主营业务的公司,这类公司通过采购一两款主流舆情软件来提供服务;另一些公司不主打舆情,但客户有舆情软件方面的需求,这类公司会通过与舆情软件厂家合作,以贴牌的形式提供舆情软件。
不少舆情服务商号称能做到“全网”采集,鉴别一款舆情产品是否真的具有全网抓取能力,不妨从以下三点入手:
一是通过数据量来比对,同等条件下剔除垃圾数据或冗余数据后的数据量越大,真正实现全网抓取的可能性越大;二是比对一些超级app的数据,如某条、某音、某手等的数据,量大者定向抓取的可能性越大;三是给服务商命题,如提出采集一些生僻网站某个板块的数据,在舆情软件中展示,无技术能力的贴牌厂家无法提供定制化抓取服务。
系统是否具备跨平台信息展示能力?
能否覆盖移动端?
◆ 舆情软件应用场景:重度使用+轻度查看+案头工作+移动办公
◆ 系统应完整覆盖PC端+移动端
◆ 联动测试、综合评判
一款优秀的舆情软件应具备跨平台信息展示的能力,提供覆盖PC端及移动端的服务载体。目前主流的PC端服务都是以网页系统的形式呈现,用户无需下载安装文件,仅需在浏览器内登陆及操作。
移动端服务主要指IOS平台APP、安卓 平台APP及微信小程序,三者各有优劣。安卓和IOS平台APP可划为一类,优点在于操作更流畅,PC端软件功能还原度更高,缺点在于需要下载并安装。
微信小程序的优点在于根植于微信生态内,无需安装,同时支持安卓与IOS系统,缺点在于使用时需占用微信界面,影响微信使用,同时信息预警、原文跳转等重要功能受制于微信规则无法完整使用。
总体来说,只有完整覆盖PC端及移动端的舆情软件才能够对重度使用、轻度查看、案头工作、移动办公等多应用场景提供足够的支撑,建议在测试过程中对PC端及移动端进行联动测试,综合评判。
系统的自动研判能力、预警准确度如何?
分析时是否引入人工智能模型?
◆ 预设警报关键词的传统做法容易造成误判,且词库维护耗时耗力
◆ 将人工智能模型应用于语义分析,效果优于关键词库判断
◆ 仅部分头部舆情服务商能实践人工智能模型研判
系统的自动研判能力主要指对舆情信息的情感属性(正负中)的判断准确度、聚类(对相似信息的自动聚合,主要用于舆情事件研判)准确度、舆情事件自动分析(关键节点、时间轴)等一系列功能的集合。
软件界面上呈现的是系统后台分析后的结果,后台分析程序的优劣决定了一款舆情软件的分析能力。以情感属性判断为例,早期的舆情系统主要通过预设大量的警报关键词来判断信息的情感属性,通过对关键词进行细致的分类(按行业、按领域等)形成庞大的预警关键词库。
这种做法的优点在于可以在预警的同时对信息进行分类,缺点则较为明显,由于汉语的复杂性特点,简单通过预警关键词或关键词组合会造成大量的误判,同时随着关键词库的无限制扩大,词库的维护工作将耗费过多人力。
近年来,随着人工智能的兴起及相关算法在自然语言分析领域应用的逐步落地,部分头部舆情服务商通过人工智能模型来进行情感属性判断。简单来说,即向空白模型中大量输入准确的正面、负面信息,通过大量的数据注入、参数调优不断完成模型迭代,最终获得达到商用准确度要求的模型。
目前人工智能模型在语义分析应用中的效果优于关键词库判断的效果,且可以低成本不断完成进化,缺点在于技术门槛较高,具备相应技术能力且已开展相关实践的舆情供应商不多。选择舆情软件时,可询问供应商在对舆情信息进行语义分析时是否引入了人工智能模型,以考察其分析能力。
系统对新兴平台或媒介的反应速度如何?
能否快速上线高舆情价值的新载体?
◆ 整体互联网流量由PC端向移动端迁移,给舆情软件升级带来挑战
◆ 系统需将高舆情价值的新载体快速纳入技术规划,快速上线
◆ 移动互联网时代的信息抓取需强大技术支撑
◆ 观察系统对新兴平台的覆盖数量以及单个平台的数据量多寡
互联网信息的媒介载体大致经历这样几个时期:门户网站时期、微博时期、以微信和头条代表的图文自媒体时期、以抖音、快手、视频号为代表的短视频自媒体时期,中间穿插诸如知乎、小红书、B站等在各自细分领域拥有巨量信息的站点。
以时间维度来看,伴随着整体互联网流量由PC端向移动端迁移,新的媒介形式出现的速度越来越快,越来越多拥有海量内容、舆情价值很高的站点快速崛起,这给舆情软件的升级带来了两个具体的挑战:
一是敏锐性与时效性。一款优秀的舆情系统需要对互联网信息源拥有足够的洞察力,实时发现并评估新兴的信息载体,有舆情价值的载体应快速纳入技术规划,快速上线;
二是技术难度。移动互联网的信息孤岛化导致数据来源过于分散,且不同的站点、APP的信息抓取策略千差万别,移动互联网时代的信息抓取难度较PC互联网时代高了很多,如果缺乏足够强大的技术支撑,即便敏锐察觉到新兴平台或媒介具有抓取价值,也无法在可控的时间内完成信息抓取动作。
用户在测试舆情软件时,可通过观察系统对新兴平台的覆盖个数及单个平台相关数据量的多寡来判断其对新兴平台的支持度和反应速度。
报告模块的智能化程度如何?
是否支持数据多样化筛选和用户个性化设置?
◆ 报告模块体现系统在非数据功能层面的功力
◆ 高智能化的报告模块应覆盖多应用场景、满足个性化需求以及导出和分享的便利性
◆ 目前市面上大部分舆情系统的报告功能都较初级,对数据多样化筛选及用户个性化设置支持不够
一款成熟的舆情系统一般都会包括信息展示、图表统计、预警、报告、收藏等几个模块,各家叫法或许不同,但功能类似。其中信息展示、图表统计等几个功能主要在舆情监看这个业务场景下使用,其效果好坏主要取决于厂商在数据抓取和分析方面的能力,而报告模块则更多体现了系统在“非数据功能”层面的功力。
一个好的报告模块能够覆盖周期性报告、事件性报告、竞品对比报告等多应用场景,同时具备足够多的个性化选项,满足使用者建立个性化的报告模板的需求,最后在报告导出及分享时,提供足够多的导出选项和分享便利性。归根结底,一个好的报告模块能够帮助使用者节省大量人工的前提下完成一份足够亮眼的舆情报告。
目前市面上大部分舆情软件的报告功能都比较初级,仅能提供一些基础的固定模板报告,对数据多样化筛选及用户个性化设置支持不够,建议用户在选择舆情软件时着重对报告模块中数据筛选形式是否多样化、是否可以对报告数据按照分析模块进行操作、分析模块是否足够丰富、分析模块是否支持多种样式等重点方面进行测试。
系统的流畅性与操作便捷性如何?
这一点其实适用于各种类型的系统,但由于舆情软件在日常使用场景中可能需要较多的操作,故显得尤为突出。各家舆情系统均支持如信息展示、图表统计、预警、收藏等主要功能模块,但由于不同厂商采用的技术架构不同以及对功能模块的设计思路不同,导致软件的易用性及流畅性存在较大的差别。为了日常舆情工作的效率及心情舒畅度考虑,建议入手一款舆情软件后,着重对系统流畅性及便捷性进行测试。
最后,考察供应商资质时,如果对方拥有“双软认证”,即同时具备软件著作权登记证书及软件企业认证则更加理想。记住:专业的事交给专业的人做。