| 贵州学习网—属于你的学习中心 |
|
/ \ 子频道1 子频道2 (用户通过2-3个关键词命中) / \ / \ 产品1 产品2 文章1 文章2 (用户通过3-4个关键词命中:这种用户最有价值) 不要空着标题:空着<title></title>无异于浪费了最有价值的一块阵地; 传统的页面中,html页面中会有类似以下的隐含信息,用于说明当前网页的主要内容关键字: <header> <meta name="keyword" content="mp3 download music..."> </header> 后来由于这种人工添加关键词的方式被滥用,大量网页中为了提高被搜索引擎命中的概率,经常添加一些和实际网页内容无关的热门关键比如:“music mp3 download”等,所以新一代的搜索引擎已经不再关心页面头文件中的人工meta keyword声明,而页面标题在搜索引擎的关键词的命中命中过程中往往有着更高的比重,如果一个关键词在标题中命中会比在页面中命中有更高的得分,从而在相应的搜索结果排名中更靠前。 标题长度和内容:不要过长,一般在40个字符以内,并充分突出关键词的比重; 如果更长的标题搜索引擎一般会忽略掉,所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必要的形容词吧,毕竟用户主要通过名词来找到需要的内容。标题内容:尽量用一些别人可以通过关键词找到的字眼(也别太过头,如果标题中的字眼超过1半内容中都没有,有可能被搜索引擎排除出索引),因此基于web日志中来自其他搜索引擎的关键词查询统计非常必要。 如果网页很多的话,尽量使用不同的网页标题,争取让自己网站的内容更多的进入搜索引擎索引范围; 因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围; http://www.chedong.com/phpman.php是我的网站上的一个小应用:一个web界面的unix命令手册(man page),在以前的设计中所有动态页面使用的都是同样的标题:"phpman: man page /perldoc /info page web interface" ,google索引了大约3000多个页面,后来我将页面标题改成了"phpman: [命令名]"这样的格式,比如:"phpman: ls",这样大部分动态页面的标题就都不一样了,一个月后google从这个页面入口索引了大约6000个页面。因此,如果网站中很多网页都使用相同的标题,比如:“新闻频道”,“论坛”,这些页面中很大一部分就会被排重机制忽略掉。 除了<title></title>外,还可以用<h1></h1>标题行突出内容主题,加强标题的效果; 在我的网站设计中:我会把用<h1>[标题]</h1>这样的模板把标题突出显示,而不是通过改变字体的方式突出标题。 其他网站设计提示 静态链接:blog网站另外一个优势在于其网页是静态链接:动态网页占到整个互联网内容的90%以上。各个搜索引擎其实能够表现的都只不过是互联网的冰山一角(3-5%),不同的只是谁让优质网页排名靠前的策略更优秀而已:大部分搜索引擎都认为静态链接的网页是优质网页,google在优先抓取索引的网页中70%以上是不带参数链接的静态网页。而且即使同样的内容,静态网页也会比动态网页权重高:很容易理解:query?a=1&b=2这样的链接由于参数顺序颠倒的query?b=2&a=1完全相同。尽量使用静态网页:目前能够动态网页进行全面的索引还比较难,而即使是google也更不会索引所有的内容,因此很少会对参数超过2个的动态网页进行进一步的抓取和分析。以下是一个phpbb论坛页面返回的http头信息: http/1.1 200 ok date: wed, 28 jan 2004 12:58:54 gmt server: Apache/1.3.29 (unix) mod_gzip/1.3.26.1a php/4.3.4 x-powered-by: php/4.3.4 set-cookie: phpbb_data=a%3a0%3a%7b%7d; expires=thu, 27-jan-2005 12:58:54 gmt; path=/; set-cookie: phpbb_sid=09f67a83ee108ecbf11e35bb6f36fcec; path=/; content-encoding: gzip cache-control: private, pre-check=0, post-check=0, max-age=0 expires: 0 pragma: no-cache connection: close content-type: text/html 为了避免隐私问题:googlebot可以通过对页面http header中的session id和session cookie进行一些甄别,这样很多需要认证信息的论坛内容就无法进入索引了。 总体上说google喜欢新的,静态的内容。因此无论从效率上讲还是方便搜索引擎收录:使用内容发布系统将网站内容发布成静态网页都是非常必要的,从某种程度上说google friendly = anonymous cache friendly。 |
责任编辑:gzu521