学习网考试学习资料

Gzu521.com

面向搜索引擎的网站设计(2)

建站知识   点击:次   发布时间:2006-7-6   【字体: 】   来源:Gzu521.com
贵 州 学 习 网
以质取胜:被pagerank高的网站引用能更快地提高pagerank
数量只是关键因素之一,来自pagerank高的页面的链接还能更快的提高被链接目标的pagerank,我只是将一些文章投稿在了zdnet中国上,由于页面上有文章出处链接,相应网页和网站整体的pagerank过了一段时间后就有了很大的提升。有时候被什么样的网站引用有时候比引用次数多更重要。这里我要特别感谢的是,当时zdnet中国是唯一遵循了我的版权声明的要求表明了文章出处,并且有反相链接的网站。
按照这个原则:能够名列yahoo!和dmoz这样的大型权威目录的头2层是非常有价值的。
了解搜索引擎的"价值观":
lucene简介这篇文章被jakarta.Apache.org的lucene项目引用以后,这篇文章就成为了所有页面中pagerank最高的页面,而google支持的一些项目,比如:folding@home,让我一直怀疑他们对政府,教育和非盈利组织的站点有特别加分,毕竟.org .edu才代表了互联网的实质:分权和共享。
但更合理的解释是:.org很多都是开放技术平台的开发者,他们会在首页这样的地方加入powered by apache, power by FreeBSD之类的链接表示对其他开源平台的尊重,所以象apache, php, freebsd这样的开源站点在google中都有非常高的pagerank。而在.edu这些站点中,很多都是学术性比较强的文档,以超链接形式标明参考文献的出处已经成为一种习惯,而这也无疑正是pagerank最好的依据。
注意:不要通过link farm提高自身的站点排名:google会惩罚那些主动链接到link farm站点以提高自身排名站点,相应站点的页面将不会被收入到索引中。但如果你的页面被别的link farm链接了也不必担心,因为这种被动的链接是不会被惩罚的。

不要吝啬给其他网站的链接:如果一个网页只有大量的进入链接,而缺乏导出链接,也会被搜索引擎认为是没有价值的站点。保证你的网站能够帮助搜索引擎更准确地判断哪些是对用户最有价值的信息,也就是说如果你的网站只有外部反向链接而没有导出链接的话,也会对你的网站在搜索结果中的表现带来负面影响。当然网站中连一个导出链接都没有的情况非常罕见,除非你是刻意这么做。正常情况下大家都会自然地在网页中加上一些其他网站的链接,带领访问者去到我们认为重要或能够提供更多有价值信息的地方,
另外在推广自己网站之前也许首先需要了解自己网站目前在一些搜索引擎中的知名度,原理非常简单,可以参考如何评价网站的人气一文。

网站推广只是手段,如何突出内容、让需要相关信息的用户能够尽快的找到你的网站才是目的,pagerank高并不代表像yahoo!这样的门户站点就能在所有搜索结果中排名靠前,因为搜索引擎的结果是搜索关键词在页面中的匹配度和页面的pagerank相结合的排名结果。因此第二个要点:如何突出关键词。


如何突出关键词:面向主题(theme)的关键词匹配
theme engine正在逐步超过pr,成为结果排序中更主要的因素,可以比较一下以下现象:
为什么查“新闻”,“汽车”之类的文字,各种门户网站的首页不在第一位?要知道他们的页面中都有相应频道的链接文字的
一篇新闻页面中,搜索引擎如何不通过模板匹配,自动将新闻的主体和页面中的页头,栏目导航条,页尾等部分的内容区分开的?
其实以上问题都可以归结为网页内容摘要的提取策略和关键词在其中的命中:
首先将能够描述一个页面内容的分成以下几种类型:

链入文字描述:inbound link text
http://www.searchenginedictionary.com/terms-inbound-link.shtml

html页面标题:title 好标题一般会将页面中最重要的关键词放在最前面,比如:abc-10型吸尘器 - xx家电城
html内容主体:content text
链出文字:outbound link text
[splitpage]

链入文字描述:inbound link text
http://www.searchenginedictionary.com/terms-inbound-link.shtml

html页面标题:title 好标题一般会将页面中最重要的关键词放在最前面,比如:abc-10型吸尘器 - xx家电城
html内容主体:content text
链出文字:outbound link text

如果按照以下规则:
一个页面中关键词命中权重:链入文字 > html标题文字 > html页面主体内容 >> 出链文字,以上现象就比较好解释了。
链入文字是页面上看不见的,但链入文字对被链接页面有巨大的作用:在现代搜索引擎在关键词匹配的过程中,匹配的过程不只看当前页面的内容摘要:很大程度上,不只看这个网页自己说自己有什么内容,还要看别人如何链接时,如何描述你的网站别人怎么称呼你,比你自己说自己更重要。。
比如查:“世界卫生组织”,返回结果中有 http://www.who.int/ 而这个页面中是没有中文的,之所以能匹配上,是因为很多链接它的中文网站使用了:<a href="http://www.who.int/">世界卫生组织</a>,所以,这个页面中不存在的中文关键词也成为了页面摘要的一部分。这样一想,就可以知道链出链接的文字其实是为被链接的子频道首页或者内容详情页服务的。对自身页面的关键词密度只有负面的影响,这也是google建议一个页面中链接不要超过100个的原因:他根本不索引100个链接以后的内容。按照以上规则,搜索引擎将一篇新闻详情页中的新闻内容提取出来就是把页面上所有带http链接的文字都去掉,就是新闻的内容部分了,更精确一些可以通过取最长文本段落等策略实现;而很多网站首页或频道首页中几乎全部都是链接,经过搜索引擎分析的结果就是:什么内容也没有,能够被命中的关键词仅仅是别人链接你用的“网站首页”和频道标题title中的站点名称等的几个关键词,而页面中其他的文字则远远不如相应子频道和具体内容页面的匹配度高,而搜索引擎能够通过以上规则,让用户更快的直接定位到有具体内容的内容详情页面。因此希望通过一个首页,尽可能多的命中所有希望推广的关键词是不可能的。让网页尽可能多的进入搜索引擎的索引,然后把握好整个网站的主题风格是非常重要的,让网站的主题关键词能够比较均匀的按照金字塔模式分布到网站中可以参考:网站的主题金字塔设计          网站名称(用户通过1-2个抽象关键词)

上一页 下一页
本文共7页: 第 [1] 2 [3] [4] [5] [6] [7]

责任编辑:gzu521

网页设计分类
HTML教程
CSS教程
Javascript教程
Dreamweaver教程
FrontPages教程
FireWorks教程
Flash教程
PhotoShop教程
建站知识
分类推荐信息
更多...
大类最新文章
更多...