& r+ L J. ~ @4 V: N 百度互联网创业俱乐部搜
) h5 V( e6 p5 Z7 G索引擎优化指南
7 N& ~- k- w5 E/ X& P2 {版本号:V1.0
! ^! s3 N" }" z6 C, N@ Baidu 2010
1 Z, B+ s* i4 L, j2 百度搜索引擎优化指南 8 m# b" G0 [6 ]. Q2 i* o
) K: N/ i2 W" J9 i4 F4 J
& Z) `2 U- L" b. ^1 k+ J
3 ?1 s- p5 n, L* {前言 ( R9 s1 S* ^ x2 y, v
SEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎
( G+ {. M" @7 \. R8 T0 o自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为 ; s: {# i- e9 }3 u
的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search
$ w2 ?6 |# C$ }! N) Aengine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。
( p+ }, I: h- Y [毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种
+ i1 w' s1 G" b6 U1 E- {7 |对立源于两方面: 2 D' i1 Z7 s0 |. s3 X8 o3 w) J
一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否
5 s" [; H! w' w( U2 {! H$ D6 Y符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的
0 X# a: x1 ~6 A严厉打击。
, Y* B! P1 V G, ~; L9 \- O5 j" p另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立
2 v0 ^3 j( u! H3 g- `; @! {的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益 2 Y; m6 s+ c# }, V. n
就是不可调和的。
. s* b5 }& i: c& e但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的
B5 u2 b8 J1 W; r地方的:
: K9 a( G9 C# Z7 @首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源,
; h6 N' n* v t# x7 p* f是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起
' ]5 ?9 A/ V. j& J8 F这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改 : L2 H8 a8 W, ?
善用户搜索体验。
2 j& E: H/ e% D8 c: @其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市 1 V3 P! B' n9 N; C) G6 U0 L( h5 a9 B
场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以 # @. p" x" D! X4 l% t
扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。 8 m0 O& i! K" C2 V
基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更
! @: B2 s0 F5 m1 P加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百
8 O* k/ ?! m' L; p度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。 - ]/ p1 q4 o" Z1 q2 t, X& l- w2 g
我们先来看一下过去的问题所在。 8 S5 M3 j9 i0 A( `# t! V( a' ~
(1) 黑帽SEO 大行其道,占据了SEO 主流话语权 - Z/ T6 ?* K0 e+ I$ g5 Q
黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺
; T' l; a) w, {陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害
; w; b: Q ^5 n3 百度搜索引擎优化指南 ; \! a. ?3 x3 `3 l0 N1 @0 `
用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短
, r# b! _: [. v2 n期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领 1 n: }% E r. _1 D
域,破窗效应是非常明显的。 " b% G6 M/ x% e
很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态
. ~- `! U h2 a1 L b的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则, . e0 @# N" Q I9 L
就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。
* d5 i+ D B* W# Q2 y8 T9 Z* z) ~对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环 / q2 C6 x$ @) t- ^3 o5 n( Z& P
境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽 - z, J/ a' p- X- p; d, W
SEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆 7 U4 Y! g7 t, o; x" s4 x9 W
论氛围。这是我们必须要去扭转的。 3 k: }7 P, l" n6 c3 R0 w2 ^
总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此,
. Q% j6 ]1 @5 Q) A g将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑 3 X& P$ Y, L, H
帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。
+ l8 ?9 o! F% q3 c(2) 白帽SEO 行为得到的指引不够清晰
; y0 l* s7 T8 H5 d. o/ z所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好,
2 [+ J' m$ R- @, d; K4 X并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的
1 ]1 i5 k* H+ h2 _2 `) X9 v+ r行为是推荐的。这导致很多白帽优化心存顾虑。 6 K( x: {: W' C1 y, E
正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围, * ^6 g- w$ R- B6 c* Z- g
以使SEO 行业,有更加良性的发展。 $ D5 J) U! y: Y+ d
需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完 / s+ N& p( O* G! R5 V, J
美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见, 8 A, O# T+ P! X1 @: q$ R5 p$ E' r
来不断的完善这一指南。 ( n( ~( e2 Q+ A& N3 ^
4 百度搜索引擎优化指南
9 _3 V$ [/ p" o: U! }& L" ~目录
, S- j+ m) U5 z. {前言.. 2
& _7 h1 x# Q7 d. q目录.. 4 & ^6 Y. ?4 T% e
1 前期准备.................................................................................................................... 5 * W4 n5 Z; L# c8 \; Y% a
1.1 域名注册.................................................................................................................... 5 ' z8 c3 U6 t/ ]- p8 _1 [$ l- C( `
1.2 服务器、空间租用..................................................................................................... 5
: k* N4 B) o" V8 A5 _2 面向搜索引擎的网站建设.......................................................................................... 6
' I; d6 w. [8 I& ~0 T4 Q2 r5 g- _2.1 良好收录.................................................................................................................... 6
; g4 v3 }" w+ K/ f) E/ L w4 a+ z2.2 良好排序.................................................................................................................. 11
: C$ z6 e+ | _" h6 w1 _. n9 W2.3 良好展现.................................................................................................................. 13
: J/ ]8 f/ _2 M s/ W# Z3 网站运营.................................................................................................................. 15 R& }( w2 r _$ r7 R* [
3.1 目标=转化率............................................................................................................ 15
6 w9 _( g, h/ R( o3.2 搜索引擎流量分析................................................................................................... 15
( z( Y% L3 X" M) @0 l8 r3.3 网站信任度.............................................................................................................. 16
' X1 G6 p: N) D J" M0 h3.4 不断强化品牌概念................................................................................................... 16
$ L+ P1 ?3 @6 I* Z4 作弊与惩罚.............................................................................................................. 16
5 A1 n0 J: [4 J4.1 百度如何定义作弊................................................................................................... 16
, p! s$ g; m. P; u& _$ B/ `# L4.2 作弊会受到怎样的惩罚............................................................................................ 18 0 F3 [9 ~. p4 K7 R6 Q
4.3 改正后能否解除惩罚? ............................................................................................ 18 1 r8 ~1 u+ o# ]; N3 w$ d( L3 ]# q
5 联系与反馈.............................................................................................................. 18 & ?. i# B3 o8 z: }
6 关于百度的十万个为什么........................................................... 错误!未定义书签。
5 j2 {$ i# f( |1 p5 百度搜索引擎优化指南
1 X8 B4 t3 j* i: o% y1 前期准备 ) C- G* c4 J4 E% H. J
域名和服务器空间是网站建设的基础。
1 T8 l7 K& U y' I+ P1.1 域名注册 6 z! r$ D' }6 {; d, D& i' ~/ f
域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注 $ I1 t9 [' Q3 `1 a- B9 x
册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户
% X/ a9 V( @0 f推荐。
. j$ Y! @% i; K( P+ k3 f, f: |(1) 域名尽量简短,越短的域名,用户的记忆成本就越低 " G( N; a {2 [2 P6 g" h
(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如
, o, W/ @' k# b* \# [! ^9 E使用公司名称、商标、网站名称或者公司产品等信息来选择域名 6 I1 K. ?" ~! g; Y) R, b
(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用
{& \7 D! H( t; A6 @户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可
0 i7 B1 ]" X# P& c: U# {能会让用户产生不信任感,增加用户的判断成本。 , ?2 [ i- g& g& k6 ~+ E; o
1.2 服务器、空间租用 4 K( Q3 U4 n0 r" n1 y$ y
服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建
- p. C( F6 q8 G& i; V& O4 ^+ h议选择服务稳定、速度快的服务器或者空间。
* Y6 C3 S+ t# K" E: c3 b8 h+ X(1) 选择有实力的正规空间商
! \7 R6 b+ j+ u1 P服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力 4 c0 u- k7 n: ]9 K7 f. ]
提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉
' I0 b/ T+ _, r- v; l! T$ uBaiduspider 的抓取,导致网站无法被百度网页搜索收录。 2 R0 r; D" [! U2 x0 j2 Q
(2) 保证用户的访问速度和稳定性
7 Y- ] V3 X& M+ A7 g(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器) ; p( I% k( z* z' t2 P
通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳 4 l( u5 a: P3 ]* u3 k6 z( B% v" E
定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可 ( q% e B$ ~* i2 p
以根据自己的需求来进行合理的选择。
' h9 i z9 s) l(4) 根据用户群分布选择接入商 5 N3 L8 f: e' \- V# g% A
由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通 4 \3 N D9 j. w6 o% v
访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在
9 m r# N" C4 H4 {: V全国,那就选择一家互通处理的比较好的接入商。 5 S" v) i/ P. @: [
6 百度搜索引擎优化指南 ' d! z- {5 H# t9 |- ^
购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。
7 F6 G, k8 S# _$ `1 L2 面向搜索引擎的网站建设
& Z% Z8 g% l9 X! a5 R) @搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断,
2 e; F# F9 G* i* B+ e也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的
; {5 b8 Q' v' I; H优化,同时也会让用户受益。
$ K5 Y9 d, T, R" D# i面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内
7 @/ }& ^/ m4 f+ E T容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简 / Y, B3 M+ I$ b. a- H- E9 z9 Q' j
单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。 : h! s: S# S$ ^4 `4 D# m
2.1 良好收录
, X/ e/ W. X% n2 B( O0 H# I2.1.1 机器可读
" u. [9 g# [3 }; y% {百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。 7 H3 r* l; d' g0 G5 ~: J
目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、 # l- J' J1 X. ?+ O
图片中的文字,百度无法识别。
8 l' j6 w3 ~5 l( w% H建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎 7 h9 P3 D$ W4 ^1 m! Q( {2 Y# L
暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、 8 s. [4 ^( b3 I6 W
Javascript 中包含链接指向的网页,百度可能无法收录。 ) v$ A9 \1 O# d1 k. A3 ^
冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接 ! H1 T6 i) Q+ j$ o
冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页
: _! d, [' R6 t% S% S使用文本链接指向文字版 , |) \+ `" H7 k5 W8 T4 a* E
冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看” $ G7 f, W, `4 Z/ s( H4 ^
到的导航及正文内容放到Ajax 中
( Y& t% D+ x$ _6 @冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃 * R) @4 ]# Y5 P) i7 K6 h: R8 ]
我们建议:
4 ^3 j: w. D' J$ w5 ~( F: F9 X7 百度搜索引擎优化指南
: g6 G$ y) E, L- |7 G2 V上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对
; E k* ?2 C) I5 H+ U5 d, z0 o搜索引擎来讲,这个网页没有任何内容。 % N+ ]5 W e1 I* M# A3 V) p
2.1.2 网站结构
* L0 d; M, l" j& C7 a f c7 `- _0 z网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的 7 H0 v- B" b' {. ~; y- e6 ^
内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。 1 @; _2 U- m$ W+ V8 A
网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章 - e+ P3 B F9 a# C! t
页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通 7 w( S( }4 h* r; K2 L+ r8 x
内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应 5 y& _1 x) u) g7 l) z& b" H/ c
对。
% [ S5 B# U+ E/ F( O+ ?理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理
- b0 ]" W% l& O* L起来,会更简单。
8 O7 _1 B+ @) \6 p/ }同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相 * T: S" o1 F% Q) o; _9 z8 b7 d
关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页
) ^6 X2 D, p8 R/ s; M( Z: P有到上级频道以及首页的链接、内容相关的网页间互相有链接。
4 j$ U6 v4 u8 L. A, r; i4 h# T9 L网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。 # ^3 u! c) ?: @
总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。 9 a; }: r, R8 C
冘 确保每个页面都可以通过至少一个文本链接到达。 ) r5 a. z8 Q, U" W
冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。 8 A+ S; v4 t5 U/ v
我们建议:
4 d- d/ f" ^" }2 x8 y8 百度搜索引擎优化指南 * ~# M3 e4 v; r9 B/ i7 J# g% c
冘 合理分类网站上的内容,不要过度细分。 + }1 S4 Q; y1 S& C
网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助 , ?* R. N: S' v
搜索引擎更好的了解网站的结构。
% H# S8 t8 ^/ {( L冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎
5 `; [" I9 i* |方便的定位网页在网结构中的层次。 1 ]/ T, Z4 \( F0 P, `/ k/ X
冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网
: e+ I4 Y- ]8 V, u* l站首页> 频道> 当前浏览页面 6 E4 ~) r, }- v* J* o# x
通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上
4 m, x0 Z1 F. a+ j _一级频道或者首页也很方便。 6 z5 G* z7 L% M+ {* p
冘 导航中使用文字链接,不使用复杂的js 或者flash
! e6 s# P8 k; J: p8 W7 o冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么 * o' m( j# @$ L& N# @9 L
2.1.3 子域名与目录的选择
% {* P4 F3 t8 k5 }. x" |- L, S1 }选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大 # [2 W: z# n( k G1 {7 w5 K
的影响。
# I( I3 X+ ~ S+ E$ _& L9 ?冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频
* `2 @( d$ V4 B" I, `3 ^道下积累了足够的内容,再转换成子域名的形式 ' _% ?' }# H* l( p
一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的
* Z W( ~* d6 V- k/ b# s' n( M网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的,
6 C: L: [2 _5 O* [4 y: h1 S! G子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。
+ H; J5 e/ M( \7 L1 l3 t在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在 " H- d7 A, ^0 |5 G) e3 z* V
搜索引擎中获得更好的表现。 2 U# ~4 B$ Z& K( I7 w+ G# |6 J; _5 y+ j
冘 内容差异度较大、关联度不高的内容,使用子站点形式 5 ^, }$ d8 _6 U) N* {/ }
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误 5 B2 k( b& a( a
的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点
/ k- z E! n' b, p/ S的主题。 " S6 G. G# ?) C1 C! \
冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b.
* t ]- W% K* X, E8 B# K# a# Qexample.com 访问 7 v" N; K) S# n y& K0 n
子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理, ! C; d( W( a0 ?3 s2 m$ Q
我们建议: / G; B! M& c: d3 G8 q- z
我们建议:
5 U/ |* s5 D4 B% W+ ^9 百度搜索引擎优化指南
. q8 O5 m; P( _7 e% f7 H6 h保留的url 不一定是正常域名下的。 F1 ?3 g R/ g$ Q5 M5 d
冘 不要滥用子域名
: g, h( k' }# r7 r& O0 ^无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|