摘要: 【目的】论述 Web 信息抽取技术在新闻舆情分析中的应用,为舆情虚假信息甄别、舆论引导提供新方法,从
而避免对大众的思维、想法等造成不良影响?!痉椒ā垦芯刻岢隽嘶谛锌榉植己突谕臣朴胪辰峁沽街植?同的新闻正文信息抽取方法,使得在对 Web 新闻数据采集和存储的基础上,正文信息抽取更加高效和准确。【结果】
两种 Web 信息抽取技术可以广泛应用于海量新闻数据分析、舆情监测等应用场景。【结论】通过基于行块分布函数
的抽取方法和基于统计信息与网页结构的抽取方法,能够分别对轻量网页和大流量网页抽取信息时表现更优。