网站推广

广州SEO > 网站推广 >

又名鹤山站长网-TF-IDF值是什么来的?

  几天咱们研讨了查找引擎是怎么判别文章的类似度的。搜素引擎经过余弦类似度和最长公共字符串,来核算两篇文章的类似度。那在一篇文章中,查找引擎怎么判别关键词的权重呢?今日SEO卧虎就来和大家剖析下这个问题!
 
  1、经过TF-IDF算法,核算每个可能关键词的TF-IDF值
 
  经过计算词频和文章数量,来核算关键词权重的TF-IDF算法是查找引擎常常运用的一种算法。TF代表词频,指的是一篇文章中某个关键词呈现的次数;IDF称为逆文本频率,代表文本频率的倒数。例如:“SEO训练”在卧虎SEO的一篇文章中呈现了10次,那TF值就是10;“SEO训练”在百度查找成果中呈现100W次,那IDF值就为1/10000000。“SEO训练”这个关键词的TF-IDF值为10*1/10000000=1/1000000;而在相同的一篇文章中,“SEO公司”也呈现10次,“SEO公司”在百度查找成果中呈现170W次,那“SEO公司”这个关键词的TF-IDF值就为:10*1/17000000=1/1700000。成果就是“SEO训练”TF-IDF值>“SEO公司”TF-IDF值。SEO训练在这篇文章中的重要性相同大于SEO公司的重要性!
 
  怎么判别关键词权重之“SEO训练”
 
  2、经过方位信息判别重要性
 
  一般咱们写文章的时分,在榜首段往往是对文章进行概述,在最终一段需求对文章进行总结。所以在首段和末段中呈现的关键词,查找引擎会给予更高的权重。这一点相信许多SEO都有共识,一般都会在榜首段中加要点关键词,但许多人都忽视了末段的重要性。其实末段的关键词权重也是非常大的!
 
  3、标题中的关键词
 
  咱们曾无数次的提起文章标题的写法,着重标题的作用。是因为查找引擎给予了标题特别高的权重,标题中呈现的关键词,权重要远远大于内容中呈现的关键词。所以咱们在写文章的时分,必定要在标题中呈现咱们的中心关键词!
  4、运用词性信息判别重要性
 
  什么是词性信息?这个咱们在小学的时分应该都学过,就是“名词、动词、形容词、介词、代词”等等。一般来说比较重要的词多为名词或许名词结束的词,所以查找引擎在对文章进行分词之后,紧接着就是对词性进行区分,找出文章中的要点词。
 
  5、用符号着重过的关键词
 
  一般运用“”和《》之间的文字更可能是关键词,比方“冯提莫床照”是真的吗?这类词尽管可能不是文章最中心的关键词,但一般在文章中归于要点关键词。
 
  6、被改动色彩、加粗、歪斜设置的关键词
 
  一般咱们写文章想要着重某个关键词,最习惯的做法就是对关键词进行加粗。也就是运用一些排版的办法,将某一个关键词变的和其他的关键词不同,查找引擎检索到这种不同之后,会将这个关键词设为要点词,提高关键词的权重。
 
  其他的还有构建文本词网络、将词进行语义聚类等判别关键词的办法,查找引擎必定不会单单运用一个办法或许一种目标来判别关键词权重的,应该罗列了至少十几乃至是几十种办法来判别关键词权重。其实你也没必要非要去研讨怎么去做,只需求依照正常的办法去写文章即可。只需你是围绕着一个中心点来写的,没有跑题,查找引擎绝对可以判别出文章的中心和各个关键词的权重!
浏览过本文章的用户还浏览过
  • 如何优化搜索引擎?干货现场教学【Direct Hit算法】

    这样,关于一些排名较后或许新登录的网站很难有时机取得点击,然后一向无法进步自己的排名。另外,有些网站为了进步自己的排名,屡次从Direct Hit的同伴中点击自己的网站,来骗得好的排名成果。对此,Direct Hit也选用相关的技能来屏蔽一些重复的点击,确保排 [详细]

  • 提高百度权重有哪些比较有效的方法呢?

    直接就发布到自己的所担任的渠道上面。每天都这样发布着与其他渠道一样的同质化内容,导致网站的录入和排名总是提不高,关键词得不到好的排名。 [详细]

  • 百度竞价什么意思有什么技巧我们一起看看

    广告主最多可以在推广计划或推广单元中添加200个否定关键词和200个精确否定关键词。推广计划级别的否定关键词/精确否定关键词对其中的所有推广单元起作用,但某个推广计划的否定关键词/精确否定关键词不会影响其他推广计划。 如何为关键词选择匹配方式建议 [详细]

  • 石榴算法百度绿箩算法今天我们一起回顾一下

    信息散落在百度资源平台各处,集中在这里,省得以后记不住,其实现在已经记不住了,读者们也可以做个参考。以后有百度官方命名的更新,会更新在这个页面上。 [详细]

编辑推荐