当前位置: 首页 > news >正文

NLPIR大数据挖掘平台新增敏感词扫描功能

  在网络日益发达的现在,也伴随着有益信息与造成不稳定因素的信息也随之日益泛滥,为了网民的思想健康,也为了社会的和谐,在许多对外公共场合下,有些内容是要经过审查才能显示的。在网络审查初期,都是通过人工审核,这种审核方式虽然准确且智能,但与网络文字产生的速度相比,其效率就显示微不足道了!因此,自动化的系统处理方式的需求越来越强烈……

  而NLPIR大数据挖掘平台是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。经过灵玖软件专家的不断努力新增加了敏感词扫描功能。

  NLPIR大数据挖掘平台敏感词扫描功能是针对互联网关键词敏感搜索的需求,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。组件以Data文件夹的设置同分词,只需要设置data所在目录即可,采用KS_Scan等技术,通过分别扫描文本内存与文件,可以得出敏感关键词及类别、权重等信息。

  NLPIR大数据挖掘平台敏感词扫描功能是灵玖软件多位专家经过不断研发和实验,针对敏感关键词搜索业务需求而打造的一套组件系统,具有专业精准、高扩展性和高通用性的特点。可支持文字、数字、特殊符号、繁体字等各种文本关键词的敏感扫描,支持各类数据库实时搜索服务,并支持多语言。

  NLPIR大数据挖掘平台敏感词扫描功能特点:

  1、强大的数据资源

  组件包含有十大类型各行业的敏感关键词词典。这些词典几乎囊括了所有行业里面的敏感关键词,从而净化互联网文章环境。

  2、先进的技术支持

  组件采取先进的NLPIR大数据搜索与挖掘系统,可以针对原始文本关键词集进行处理和加工,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。同时,组件可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用,分词扫描平均速度单机可达20MB/s。

  3、广泛的应用场景

  组件可以运用到广泛的场景,如公安、广播、电视、报刊杂志以及广泛的网络信息内容安全服务;如新闻网站、信息网站文章过滤筛选服务;如信息传播的实时过滤服务。

转载于:https://www.cnblogs.com/ljrj/p/6378660.html

相关文章:

  • 面试(二)
  • 第六课、窗口组件及窗口类型------------------狄泰软件学院
  • Git:常用操作
  • Xen server虚拟化中虚拟机磁盘文件丢失的处理办法
  • C语言截取字符串或反转字符串
  • 彻底搞定C指针-函数名与函数指针【转】
  • Spark上的深度学习框架再添新兵:Yahoo开源TensorFlowOnSpark
  • CSS小知识点-1
  • .net利用SQLBulkCopy进行数据库之间的大批量数据传递
  • 快速理解 session/token/cookie 认证方式
  • Pivot Table系列之展开/折叠用法 (Expand/Collapse)
  • hadoop 中什么是slots
  • 构建NCBI本地BLAST数据库 (NR NT等) | blastx/diamond使用方法 | blast构建索引 | makeblastdb...
  • 在一个公司待上多久跳槽最合适?
  • MySQLMySql免安装版安装配置
  • EOS是什么
  • Hexo+码云+git快速搭建免费的静态Blog
  • Laravel Mix运行时关于es2015报错解决方案
  • php中curl和soap方式请求服务超时问题
  • Python3爬取英雄联盟英雄皮肤大图
  • Python代码面试必读 - Data Structures and Algorithms in Python
  • react-core-image-upload 一款轻量级图片上传裁剪插件
  • Redis 中的布隆过滤器
  • scrapy学习之路4(itemloder的使用)
  • Selenium实战教程系列(二)---元素定位
  • Spark RDD学习: aggregate函数
  • spring security oauth2 password授权模式
  • Web设计流程优化:网页效果图设计新思路
  • 翻译:Hystrix - How To Use
  • 蓝海存储开关机注意事项总结
  • 利用阿里云 OSS 搭建私有 Docker 仓库
  • 如何使用 JavaScript 解析 URL
  • 用 Swift 编写面向协议的视图
  • 原生 js 实现移动端 Touch 滑动反弹
  • d²y/dx²; 偏导数问题 请问f1 f2是什么意思
  • 阿里云服务器购买完整流程
  • ​软考-高级-系统架构设计师教程(清华第2版)【第12章 信息系统架构设计理论与实践(P420~465)-思维导图】​
  • #pragma once
  • #pragma 指令
  • #鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行
  • (0)Nginx 功能特性
  • (02)Cartographer源码无死角解析-(03) 新数据运行与地图保存、加载地图启动仅定位模式
  • (八)Docker网络跨主机通讯vxlan和vlan
  • (分布式缓存)Redis持久化
  • (附源码)计算机毕业设计高校学生选课系统
  • (四)Tiki-taka算法(TTA)求解无人机三维路径规划研究(MATLAB)
  • (最简单,详细,直接上手)uniapp/vue中英文多语言切换
  • ***监测系统的构建(chkrootkit )
  • .NET 2.0中新增的一些TryGet,TryParse等方法
  • .net分布式压力测试工具(Beetle.DT)
  • .net生成的类,跨工程调用显示注释
  • .Net中wcf服务生成及调用
  • [ CTF ] WriteUp- 2022年第三届“网鼎杯”网络安全大赛(白虎组)
  • [ 云计算 | AWS 实践 ] Java 如何重命名 Amazon S3 中的文件和文件夹
  • [ABP实战开源项目]---ABP实时服务-通知系统.发布模式