初學(xué)
池州網(wǎng)站優(yōu)化的人常常問(wèn)關(guān)鍵詞密度是多少最合適。其實(shí)關(guān)鍵詞密度在現(xiàn)在的搜索引擎算法中已經(jīng)是一個(gè)不太相關(guān)的概念,SEO人員完全不必關(guān)注。觀察排名在前面的頁(yè)面,我們會(huì)發(fā)現(xiàn)其中既有密度低到1%或2%的頁(yè)面,也有高到20%的頁(yè)面。只要自然寫作,頁(yè)面中必然出現(xiàn)幾次關(guān)鍵詞,這就已經(jīng)完成優(yōu)化了。
另一個(gè)與正文關(guān)鍵詞出現(xiàn)有關(guān)的概念是TF一IDF。TF就是上面說(shuō)的詞頻(temfrequency),IDF 是逆文件頻率(inverse document frequency)。針對(duì)一個(gè)特定關(guān)鍵詞,包含這個(gè)關(guān)鍵詞的文件數(shù)量除以數(shù)據(jù)庫(kù)文件總數(shù),得到這個(gè)詞的文件頻率。反過(guò)來(lái),文件總數(shù)除以包含這個(gè)詞的文件數(shù)量(通常真正計(jì)算時(shí)還要取對(duì)數(shù)),就得到逆文件頻率。所以,語(yǔ)言中越常見(jiàn)的詞,包含這個(gè)詞的文件數(shù)越多,文件頻率也就越高,逆文件頻率越低。
逆文件頻率代表了這個(gè)詞的語(yǔ)義重要性或者說(shuō)區(qū)別文件的能力。舉例說(shuō),“的”在幾乎所有文件中出現(xiàn),文件頻率極高,逆文件頻率極低,也就是“的”這個(gè)詞的語(yǔ)義重要性很低,幾乎無(wú)法用來(lái)代表和區(qū)別文件內(nèi)容。“搜索引擎”這個(gè)詞只出現(xiàn)在一小部分文件中,逆文件頻率要高得多,對(duì)文件內(nèi)容來(lái)說(shuō)重要性要高得多。