K风网页搜索(.NET)|K风网页搜索(.NET) V2.2 SP5下载

  • 时间:
  • 浏览:0
  • 来源:3分彩网投平台-3分彩投注平台_3分彩娱乐平台

K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多多多线程 挂接系统、智能分析系统、海量索引系统、全文检索系统四大每项构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想外理方案。

K风网页搜索V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引下行速率 ;

SP5:修正改进搜索算法;



SP4:修正、优化每项核心多多线程 ;

SP3:优化检索流程、修复多多线程 错误;

SP2改进:修正检索组件错误引起的检索下行速率 慢间题,大大提高检索下行速率 ;

SP1改进:增加哈希值长度,基本能达到50%挂接,全面爬行整站网页、增加搜索风云榜功能;

K风网页搜索V2.1版本主要改进:使用.NET技术开发Web前台多多线程 、采用UTF-8网页编码、全新索引系统、开放管理工具源代码;SP1改进:修正自动识别网页编码、改进哈希使蜘蛛爬行更全面、修正特殊状态跳出的入库错误等;

K风网页搜索功能特点

  • 多多多线程 网络蜘蛛
  • 网页定向挂接
  • 多语言网页编码自动识别
  • 哈希表网页去重
  • 智能网页正文抽取
  • 基于词库的智能中文分词
  • 中文分词词库管理
  • 海量数据毫秒级全文检索
  • 缓存技术
  • 网页快照
  • 高级搜索
  • 竞价排名

网络蜘蛛

网络蜘蛛采用多多多线程 并发挂接网页,结合高效的挂接机制和策略部署,最大限度提高网页挂接的下行速率 。支持网页定向挂接,垂直搜索引擎提高数据质量和相关度的关键技术,用户还时要自定义挂接规则针对特定网页进行挂接。支持多种动态和静态网页类型挂接,多语言网页编码自动识别。采用哈希表网页去重技术,具有高性能、低系统占用的特点,使网络蜘蛛高效稳定运行。支持单个或批量网站挂接、自动挂接、自动更新功能。

正文抽取

智能网页正文抽取技术,它的作用是把俩个网页的主题中心内容抽取并把与该网页主题无关的信息(广告、导航、版权等非网页正文内容信息)过滤。这项技术有效提高网页信息挂接的质量和检索相关度,智能自动识别、准确网页正文抽取,准确率达到95%以上。

中文分词

基于词库的智能中文分词技术,支持中英文切分、中文简繁字体转换、全角半角转换、中文姓名识别等多项智能分析技术。用户还时要根据被委托人的应用时要扩充和维护词库,以达到最佳的分词效果。

全文检索

采用海量数据索引系统架构和先进的全文检索算法技术,结合高效的检索优化策略,支持海量数据毫秒级检索下行速率 和多用户并发检索。高级搜索支持自定义检索方式 ,满足用户不同的检索需求。采用高效的缓存技术策略提高系统的稳定性和负载能力、减轻系统负担,缓存数据根据特定的条件自动更新。

适用对象

  • 适用于企业、政府机构、学校等结构网站群组或Internet网站群组建立网页搜索引擎;
  • 适用于各行各业领域网站群组建立行业网页搜索引擎;
  • 适用于省、市、区等地方网站群组建立地方网页搜索引擎;
Tags: K风搜索   K风网页搜索   网页搜索   K风