找回密码
 立即注册

扫一扫,极速登录

搜索
热搜: 股票
查看: 12|回复: 0

解密搜索引擎技术实战

[复制链接]

105

主题

0

回帖

325

积分

中级会员

积分
325
发表于 2015-11-7 10:00:00 | 显示全部楼层 |阅读模式

 书名: 解密搜索引擎技术实战

 
作者: 罗刚编著
 
出版社: 电子工业出版社
 
出版日期
 
文摘: 本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现以及在搜索引擎中的实用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍并总结了实现方法。在全文检索部分,结合Lucene 3.0介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的最新应用方法。
 
大学教程-解密搜索引擎技术实战


下载地址:
游客,本帖隐藏的内容需要开通会员才可浏览,请先升级
声明:本站所有资源,均为用户自主上传,仅作为学习交流之用,其版权归原作者或原出版社所有,本站不对所涉及的版权问题负法律责任。如有侵权,请点击网页底部【举报】联系我们删除!
高级模式
B Color Image Link Quote Code Smilies

本版积分规则

QQ|举报|手机版|小黑屋|好多课学院

GMT+8, 2025-1-17 00:59 , Processed in 0.026305 second(s), 5 queries , Redis On.

快速回复 返回顶部 返回列表