对于接触比较深的人来说,可能会接触到一些常人所不太长接触的词汇,今天我们来看的是一个叫做“词频”的词汇,这个词汇按照字面意思,很容易理解为“”,但是实际上两者还是有很大区别的,下面我们就一起来看看什么叫做词频吧。
词频的英文名称叫做Term Frequency,简写为TF,这个词汇会跟另外一个词汇“反转文件频率”结合在一起,组成一个新的单词:TF-IDF(term frequency–inverse document frequency)词频–反转文件频率。这个词虽然很长,但是它是中的一个极为重要的基础性概念。
词频的意思很简单,可以看做是一个在一个文件或者是一段话中出现的次数,理论上当然是这个关键词在该文件中的出现的次数越多越好,这样才能显得它的重要性。这点和关键词密度极为类似,但是关键词密度还要考虑关键词的字符长度,而词频会将关键词看做一个整体,只会考虑关键词的出现次数。
词频曾经是一个很重要的概念,在好多年之前的,你很容易通过堆积关键词的方式来获得排名。关键词堆积就是一种利用词频获得排名的手段,当然了,你也可以看做是利用关键词密度,其实这两者在这种情况下是一致的。
以上就是词频的概念,但是在搜索引擎中,词频实际上和反转文件频率是无法分开的,这个概念我们下次在讲吧。
声明:转载此文是出于传递更多学习交流目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。本站部分图文来源于网络,仅供学习交流,发表作品观点仅代表作者本人,本站仅提供信息存储空间服务,不承担连带责任。如有侵权,请及时联系管理员删除。
添加微信
微信扫一扫
评论