http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 5245|回复: 4

[SEO] 百度分词技术

[复制链接]
发表于 2013-3-29 14:51:48 | 显示全部楼层 |阅读模式
百度分词现在是按照怎么个算法来的?

前后匹配?求具体例子


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-3-29 15:02:52 | 显示全部楼层
分词算法是一方面,主要是百度这类网站有强大的词库,他们有办法区别什么样的词是导航,什么样的词是标题,也是根据各个网站出现的次数算的,机率问题,他们我估计现在没有什么特别的算法,更多的是利用词库。所以有些时候有些公司的强大,不是因为技术也不是因为设计,而是有着别人无法相比的资源。就像QQ的用户群一样,做什么网站只要在每个QQ右下角弹出个小窗口网站就火了。
  
   如果是我要这些的话我开始可能就不管他们,直接使用现成的就行,等强大了就做词库。
 楼主| 发表于 2013-3-29 15:23:27 | 显示全部楼层
我寻求的就是一个算法!准确的说,是黑帽技术!弄一个网站,通过分词,做到首页显示,目前本站的关键字
sufeinet.jpg
发表于 2013-4-2 09:55:29 | 显示全部楼层
Eagle 发表于 2013-3-29 15:23
我寻求的就是一个算法!准确的说,是黑帽技术!弄一个网站,通过分词,做到首页显示,目前本站的关键字

这个你只要检查关键字用什么分割的就行了,设置几个常用的,方法
发表于 2013-9-5 16:24:40 | 显示全部楼层
这个可以有。

百度的分词还是很有意思的。
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-22 19:16

© 2014-2021

快速回复 返回顶部 返回列表