Seo是寻找一种方法,获得更好的排名,根据搜索引擎的权重,对网站结构、枢纽字选择、网站内容规划进行调整和优化,从而进步网站在百度、Google、Yahoo!等搜索结果中的天然排名和网页收录数目。
Seo正在中国蓬勃发展,现在您预备好了么?用网络网住机会,现在就开始吧!
这篇电子书解析了seo的作用,影响搜索引擎排名的因素,优化一个网站的流程,学习完成之后,就可以初步了解如何寻找枢纽词,如何对一个网站进行seo优化,获得好的枢纽词排名并且获得流量了,假如你是seo初学者的话,通过学习本文,把你的流量也进步2-5倍。
第一部分 学了SEO之后能干什么?
一、搜索引擎优化的历史
1、20世纪九十年代
Yahoo是最早使用SEO技术的公司之一,那个时候,他们还没有估计到搜索产业的巨大增长潜力。世纪之交,Yahoo的联合创始人大卫?费罗和杨致远为了增加站点的曝光度,想办法让他们的网站能被互联网上其他搜索引擎发现。通过对站点结构的优化和一些“狡猾”的代码编写技巧,他们的网站变得很容易被那些新用户检索到。他们当时也没有考虑将这种服务的商业化操作,因为当时没有人清楚这样做到底是否符合商业道德,也没有可以参考的简单标准。
随着搜索引擎开始对网上的信息进行归类,企业主开始意识到站点被显示在搜索引擎上的价值了,最显而易见的是可以增加站点的访问量。他们开始不断向搜索引擎递交他们站点的网址,为了适应搜索引擎蜘蛛(Robots)而对他们的站点做出改变。前期的努力就集中在站点的递交,不久以后,自动向搜索引擎递交站点的程序诞生了,同样,臭名昭著的搜索引擎垃圾(Spam)也开始存在了。
●1994年,Yahoo、Lycos等分类目录型搜索引擎相继诞生,搜索引擎表现出网络营销价值,搜索引擎营销思想开始出现;
●1995年,自动提交到搜索引擎的软件诞生,搜索引擎营销“智能化”,此后不久许多搜索引擎开始拒绝自动登录软件提交的信息;
●1995-1996年,基于网页HTML代码中META标签检索的搜索引擎技术诞生。利用
META标签改善在搜索引擎中排名的技术很快成为搜索引擎营销的重要内容,这就是搜索引擎优化方法的萌芽;
●1997年,搜索引擎优化与排名自动检测软件问世,网络营销人员可以据此制定针对性的搜索引擎营销策略;
●1998年,“搜索引擎算法”开始关注网站外部链接,“网站链接广度”(linkpopularity)概念诞生。
2、二十一世纪
SEO专家开始出现还是近5年的事情。因为在较早的2001年,精力充沛的网站管理员们迅速认识到他们可以通过反复向搜索引擎递交来征服搜索结果。然后,不幸的是,随着互联网行业的发展,对于那些不管公正不公正,道德不道德,也不管任何代价,试图将用户引向他们客户站点的SEO公司来说,搜索引擎已经变得很危险。一些常用伎俩比如关键词堆积、门页、隐形页面或文字(比如将网页字体和背景都设置为白色),已经超出了搜索引擎可以容忍的范围。最终导致的后果是,搜索引擎将这些乱七八糟的手法列为作弊。这是一个好消息,他迫使那些有道德的SEO公司开始使用正确的手法去帮助他们客户的站点在搜索引擎上获得好的排名。
Google、Msn、Yahoo三大搜索引擎,也开始意识到搜索引擎优化这个行业的存在,可以维持和改善搜索结果的有效性,他们需要敞开怀抱接受这个行业。搜索引擎公司也开始跟一些成功的、有道德的SEO公司合作,建立了一系列公正的合法的优化标准。确保信息对于使用者来说是相关的和有效的非常重要,这样做对于那些在自己站点提供相关内容的人也不存在任何偏见。
●2000年,出现按点击付费(Pay-per-click)的搜索引擎关键词广告模式,搜索引擎广告诞生;
●2001年,搜狐等部分中文分类目录开始收费登录,网站登录每年要交纳数百元到数千元不等的费用,付费搜索引擎营销开始走向主流;
●2002年后半年,在网络广告市场最低潮中,搜索引擎关键词广告市场增长强劲,占2002年网络广告市场的15%,搜索引擎带动整个网络经济复苏;
●2003年,出现基于内容定位的搜索引擎广告(GoogleAdSense);
●2004年,搜索引擎全面引领互联网经济潮流,搜索引擎营销的价值被企业普遍接受。
3、SEO现状
目前SEO现状今天,搜索引擎的工作方式和排名规则已经有了很大的变化。在正确的搜索优化服务的帮助下,网站管理员们可以有一个公平的机会去获得较高的搜索排名。SEO是一个非常专业的服务,它不仅需要一定的技术技巧,还要有一定的商业营销知识。只有很好把这二种能力结合的人才可以正确地运用SEO技术来获得较高的搜索引擎排名。
二、SEO在中国
总体来说,SEO在中国还属于新生事物。
1、中文网站SEO变迁
●2001年之前:免费搜索引擎营销阶段,以免费分类目录登录为主要方式;
●2001年中期-2003年中期:因网络经济环境、搜索技术、收费等原因带来搜索引擎营销市场进入调整期;
●2003年后期开始:各种形式的搜索引擎广告快速发展,同时基于自然检索结果的搜索引擎优化开始受到重视;
●2004年-2005年:搜索引擎广告进入快速增长期,并且营销效果逐步为企业所认可;新的搜索引擎不断出现;
●2005年开始:垃圾SEO泛滥,严重破坏搜索引擎营销市场秩序,引起主流搜索引擎大规模清理。
2、中文网站SEO现状
A.SEO在国外已经是一门相当正规、成熟的行业,有大批的专业公司、专业技术人员在为广大客户网站提供全方位的搜索引擎优化服务。同时,搜索引擎优化技术也得到了广大网站管理者甚至搜索引擎在内多方面的认同。但据说在国内的发展情况并不理想,那么SEO在国内目前的状况如何?
相对于03、04年的混乱来说,经过了优胜劣汰的洗礼,国内SEO市场正逐渐向正规化、专业化发展,但是仍然存在着规模小、实际操作性不强等情况。
规模方面:从事SEO行业的仍然以个人工作室和小公司为主体,同时,部分国外知名企业也开始进驻中国,竞争更为激烈。技术方面:由于国内缺乏学术交流,从业人员缺乏对技术的探索与追求等因素,SEO技术在国内来说仍然处于较低水平。不过随着国外企业的到来,必将推动技术方面的升级。
市场方面:由于算法的改进,原有的所谓优化方法已经行不通,国外正规企业的加入迫使那部分对SEO理解比较粗浅者放弃或转向正当方式。行业得到了一定程度的净化。
B.Google曾对搜索引擎规则进行调整,据说很多SEO公司做过的网站从原先较好的排名消失得无影无踪,那么,这次调整对中国的SEO行业有没有什么特殊的意义,都有哪些改观(主要是由于中国一些SEO的作弊行为,对留言版进行海量信息和非法链接)?
05年以来,Google在算法方面有两个比较大的改进。
第一,调整反向链接的权重,加强了反向链接相关度的权重。第二,“沙盒效应”。“沙盒效应”主要是针对新网站,以域名正常运作时间,网站内容丰富与否,更新频率等作为一个决定最终排名的权重,而且占着极大的份量。这使得原来所谓的优化方法已经不能奏效,也加长了作业的时间。之前那种靠垃圾链接及堆叠关键词方式作业的SEO难以为继。
C.搜索引擎优化的方法有许多种。国内SEO公司或者团队主要采用哪些方法,这些方法和国外的有什么不同吗?搜索引擎优化并没有什么像外界说的那样有各种各样的方法,百变不离其宗,都是在围绕搜索引擎排名算法而进行。但是国外对于搜索引擎算法变动比较敏感,看法也比较深刻,从而能及时做出相应对策。而国内只能跟着国外的步伐艰难前进。这取决于学术环境、学术气氛及业内人士对知识的追求程度等因素。
D.一提及SEO,在部分人印象当中都说是一种作弊行为或者是违规行为,是什么造成大家对SEO有这样的印象呢?不可否认这种现象是存在的,而且可能还要存在很长一段时间。一方面,企业意识到搜索引擎优化的重要性,但又片面追求低投入、短时间、高回报;另一方面,部分从事SEO的企业或个人为了迎合客户需求,不惜作出种种承诺、降低投入来控制成本。这很大程度上取决于从业者的立场、原则,更重要的是他们对SEO的片面理解及对搜索引擎优化认识的严重缺乏。许多所谓的SEO认为,做优化不外乎关键词、外部链接,从而陷入作弊误区不能自拔。
E.我们前面提到的Google搜索规则改变,是不是暗示着国内SEO发展畸形呢?搜索引擎算法完善的过程是一个不断改进的过程。当搜索引擎开发者发现自身算法缺陷时就会进行改进,发现者可能是搜索引擎的开发者本身,也可能是使用者。两者是一种相互监督、相互促进的关系。
Google排名规则的改变并不可以说是针对中国SEO业界,更准确地说是国外从事SEO的部分人员利用了算法的缺陷使用了某种非法手段获得更好的排名,这种手法到了中国就变得更加普遍,从而迫使Google进行算法改进。目前国内存在的一些问题与矛盾并不能说国内SEO发展出现畸形了,而应该说是不断进化。如果哪一天,中国从事SEO的人士能让Google因其行为而改进算法,那说明我们已经在一定程度上超越国外了。
F.从各方面看来,SEO在中国的发展并不顺利,并且造成了一定的负面影响,那接下来我们的路又该怎么走?SEO如何朝一个健康的方向发展?
大概是从02年开始,国内陆陆续续有人涉足SEO这一领域。经历过市场洗礼、优胜劣汰,国内SEO行业正慢慢朝着正规化、规模化方向前进。
SEO行业能否健康发展,在很大程度上取于从业者自身的技术水平与职业素质,也与广大关心及参与搜索引擎营销者息息相关。首先,从业者应该端正作风、坚持立场、坚持原则、坚持以用户为中心。这也是一个SEO从业者所必需的素质;其次,在学术交流方面,我们应该更积极地参与各种形式的交流与研讨,慢慢形成一种相互交流、相互促进的学术环境;最后,网络营销者应加深对搜索引擎优化行业的认知与理解,搜索引擎优化是一个长期的过程也是一个循序渐进的过程。
三、SEOer用来赚钱创业七条大道
1、提供搜索引擎排名服务赚钱:
服务对象:中小企业网站
适合对象:SEO新手
赚钱流程:客户提供网站的FTP管理权限,然后对网站进行整体优化,然后帮助客户把几个核心关键词排在Google、yahoo和百度等搜索引擎的左侧自然排名的前10名。
模式特点:成本比较低,上手比较容易,月收入超过万元还是比较容易的,不过相对比较累。
2、提供SEO顾问服务:服务对象:大中型网站
适合对象:经验丰富的SEO
赚钱模式:按照时间收取顾问费、按照项目收入费用。
赚钱流程:系统化的对客户网站进行诊断分析、SEO策略制订、优化方案制订、SEO培训、SEO指导。通过此系统化服务帮助客户在SEO项目中节省时间,避免错误,达到最好的SEO效果。
模式特点:目前主要的模式一种,不用直接来执行,只是为客户提供SEO咨询服务,不过需要有丰富的经验和非常系统化的服务流程。
3、利用SEO打造大流量网站:
适合对象:SEO熟练者+网站制作高手(懂30分钟快速建站也行)
赚钱模式:收取广告费
赚钱流程:从SEO的角度来做一系列网站,轻松的搞到非常多的流量。然后加入网络广告联盟,申请广告代码放到网站上,然后赚取广告费。
模式特点:这是很多个人站长的一条路子,这种模式是开始累,然后赚钱越来越轻松。不过想要做好,需要了解非常多的技巧:比如网站主题的选择,域名的选择、网站栏目的规划,内容的采集,广告联盟的选择等等。
比较知名的广告联盟有:GoogleAdSense百度联盟阿里妈妈成果网……
4、给别的公司打工:
服务对象:大型网站或者公司
适合对象:不想创业的SEO人员赚钱模式:按月领取工资赚钱流程:听从公司安排做对应的工作。
模式特点:连joyo网、雅虎中国和阿里巴巴都在四处高薪挖SEO人才,其他的公司和网站就更不用说了,现在每天都有不少公司和客户请我推荐SEO人才。所以追求安稳的SEO人才可以选择这种模式。
5、利用SEO和传统贸易公司合作
适合对象:有传统生意基础的SEO人员
赚钱模式:销售产品提成
赚钱流程:与传统生产型企业合作不花钱做代理,你利用SEO打造一个营销站点,然后通过这个站点带来销售,根据销售拿提成。这种模式相当于做一家传统的贸易公司。模式特点:成本比较多,可以做的非常大,看看你身边有那些你熟悉的生产型企业,你可以尝试这种模式。
6、SEO+CPA销售联盟
适合对象:SEO人员,英文好的优先
赚钱模式:赚取佣金
赚钱流程:不需要单独搞一个网站,直接使用免费博客、免费主页就可以做。这样的网站流量不需要大,只要流量质量高,就可以赚钱。因为你想赚钱靠的不是点击,而是销售。要做好这种模式,需要具备SEO技术之外,还需要选择好CPA联盟,选择好推广的产品。CPA联盟国外非常多,比如CJ、CB、BF等等。国内的当当、joyo等电子商务网站也都有销售联盟。
模式特点:我们的不少学员都在使用这种模式,做的比较成功。这种模式门槛比较低,但是需要眼光准。你逛一逛当当或者joyo,看看他们里面那一种产品卖的比较火,但是这个产品的关键词在搜索引擎中的竞争却不激烈,那么就祝贺你了。如果你的英文好的话,机会会更多,因为国外的这种销售联盟非常的多。
7、做个赚钱的创意网站:
服务对象:全球有特许需求的人员
适合对象:想象力丰富、有网站运营经验的SEO人员
赚钱模式:收取会员费或按照服务收费赚钱流程:给会员或者顾客提供虚拟服务获得费用模式特点:网络的无地域限制使得我们拥有更多同一爱好的或者说需求的人群变得这么容易,传统方法不可能实现的事情现在都变得很简单。下面有十个创意赚钱的例子:
1.百万格子网站
相信很多人都知道这个点子,把网页分割成100万个象素格子,每个象素卖一块钱,当然都得买10X10以上的才能看的到,很多人买更多的象素。在这个网站诞生之前,恐怕对大多数人来说,这个主意听着真够蠢的,谁跟你买呀?可是这位发明这个概念的21岁年轻人已经变成百万富翁了,他的100万个象素在很短时间内全部卖光。现在有很多人在模仿。
2.圣诞老人的信
假装你是从南极写信,假装你是圣诞老人,给小孩写信并送个圣诞礼物。当然这些孩子的家长要付费,10块钱一封。听着和开玩笑似的,可是已经卖了20万封。
3.狗用的风镜
做些给狗们戴的风镜,然后在网上卖。这事听起来也挺玄,可是人家也成了百万富翁了,还开了很多真正的店铺呢。
4.激光修道士
修道士开了一个网站,卖打印机墨盒之类的耗材。是真正的修道士运营这个网站,这就是他们的特色。2005年他们的销售额是250万美金。
5.天线球
卖汽车天线上装饰用的小球小玩具之类的东西,现在还有人用这个东西吗?还在网上卖。看起来够呛,可是又一个百万富翁因此诞生了。顺便说一句,都是中国生产的。
6.健身扑克牌
出一套扑克牌,每张牌上印上一套健身方法,然后在网上卖,一付牌18.95美金。谁会买呀?我是不买。可是一位健身教练员去年在网上卖了470万美金这种牌。
7.和艾滋病患者约会
跟一个艾滋病带源者约会,这个主意怎么样?如果你不是艾滋病患者,可能想都不敢想。但如果你是一名艾滋病患者,可能听起来这个主意就不一样了。这个目标市场找的可真够精准,够令类。
8.专用尿布背包
很多母亲都要带好几个尿布出门,在路上的时候好给孩子换。但一般女士用的背包手提包等不一定适合,尿布拿出拿进都不方便。有人就建了一个网站,卖尿布专用背包,还分成了22大类。2005年刚开张,就卖了18万美金。
9.游戏控制杆
专门设计制造一种用起来比较舒服,能吸汗,手不累的游戏控制杆在网上卖。这个产品不但非常受欢迎,而且还打入了超市。
10.许愿骨
西方人有个传统,感恩节的时候拿一根火鸡的骨头两个人拽,谁拽到比较长的那段,谁的愿望就能实现。可火鸡的骨头你一年能得到几块呢?有人就在网上卖假的塑料的许愿骨。谁买这玩意儿?可是人家现在一天生产3万根。
四、SEO行业未来到九大细分市场
SEO在中国的发展来的迅猛无比,成熟的安静坦然,虽然在07年曾一度浮躁过,但是很快就开始成熟了,在未来我们的SEO市场将如广告在中国成熟了之后迅速的细分化。而且一大部分人在市场细分中找到了自己的立足点和人生的方向。我们是SEO行业的后来者,我们要想在这个行业里面做做出不错的成绩,不能老想着往前冲,应该好好想想我们是佛能在SEO的细分市场中更好的成长。
SEO市场细分之一:
互联网的大众化和他的即时通讯使得世界如此之小,使得信息交流如此之快,使得人们对某个件事情的一点影响可以被无穷的放大。从百度贴吧出来的第一神贴:
“贾君鹏你妈妈喊你回吃饭”我们就能感受到网络的无穷力量。说了这么多就是想说明一单网络上出现了关于你和你公司的负面消息,他有可能从你认为的很小变成一场席转全球的大事。防微杜渐将是这些大公司的不错选择。如是SEO将衍生出一个十分具有魅力的市场:网络危机公关。
SEO细分市场之二:
关键词分析市场关键词分析是整个搜索引擎营销策略中最重要的一环,可以这样说,如果这一环工作做不好,其他的工作的意义都将变的非常的苍白。为什么呢?因为:如果你的关键词选择的不够正确,就算排名很好,也很难给你带来有效点击。如果你的关键词选择的不够准确,就算你的排名再好,你的点击的转化率将会很低。也就是说,关键词选择的错误,将导致你众多的SEO工作都是白做,你大量的关键词广告费都将是白花。所以,关键词分析市场是一个非常大的细分市场,在美国,ebay、亚马逊等知名电子商务网站的关键词分析工作都不是自己来做的,而是交给了另外一家关键词分析服务的工作。为什么这么大的公司的关键词分析不自己做呢?因为事实证明,当他们把这项工作交给他们的合作公司之后,他们的关键词广告的转化率提高了150%。目前,美国最大的提供关键词分析服务的这家公司的年营业额能够做到上亿美元。目前,中国还没有一家专业的提供关键词分析服务的公司,这是一个非常大的细分市场,谁能够第一个做,它将可以成为轻松的成为行业老大,获得最大的市场份额。不过做关键词分析服务不是简单的事情,想把这个行业做好,需要下的功夫是非常深的。
SEO细分市场之三:
SEO培训市场SEO这个市场之所以能够在中国这么火,主要是因为中国大部分的网页设计师设计网页的时候,只能单纯的从美观角度来设计,网站程序开发人员只能单纯的从功能实现的角度来设计,于是造成了大量的网站的设计制作严重的不符合搜索引擎的口味。目前,SEO几乎已经成为网页制作工作人员的必修课,有这么大的市场需求,就有这么大的培训市场,所以SEO培训的市场也是不可小瞧的。我最早花了3天写《搜索引擎排名秘笈》能够销售的这么好,就是我看到了这个市场的需求。不过现在的SEO入门知识,而需要更加系统SEO知识,所以今年上半年,我和我的助手用了6个月的时间,完成了《搜索引擎排名秘笈》的升级版本:《搜索引擎营销》,《搜索引擎营销》内容10字,200多页内容,系统的为大家讲义SEO为主的搜索引擎营销策略。这块儿的市场非常大,除了我们目前做的网络培训外,企业内训,团体面训也将会慢慢的热起来。
SEO细分市场之四:
SEO咨询服务SEO行业虽然入门非常容易,但是想学好就不容易了,很多人常常出现这样的疑问,关于排名的因素自己也都知道,但是自己来操作中达不到理想的效果。为什么会出现这种现象呢?因为很简单:网络营销,细节制胜。SEO想做好,靠的就是众多的细节的积累。很多人道理虽然明白了,但是到了真正的操作中,很多重要的细节往往处理不好,于是就很难达到理想的效果。另外,众多比较有规模的网站如果自己盲目的进行SEO的时候,很可能因为盲目的看到网上的一些技巧,一不小心,细节问题上处理不好,很容易在SEO之后被搜索引擎给处罚掉。所以这些大中型网站在进行SEO的时候,最需要的就是要有一个非常有经验的SEO指导他们的工作人员来执行。最有用的经验都是从实践中总结的,而且这些有用的经验,还需要比较长的时间的实践的积累。所以大家可以看到一些的理论派SEO专家在对某个知名网站的SEO状况进行分析的时候,常常会遭到众多并且知名SEO的抨击,而且抨击他自己没话说,为什么呢?因为:凡事都是说着容易做着难!理论和实际是有差距的。想做好SEO,靠的是时间的积累,靠的是实践的积累,靠的是众多对细节问题处理的积累。所以,SEO咨询的市场需要也非常的不小,但是做这行,需要有经验才行。不能只学习了些理论就开始搞这个。各个公司来选择SEO咨询公司的时候一定要看对方的成功案例,另外就是要查明这些成功案例到底是不是他的。今年我发现有些特别能讲的家伙拿着我的众多案例说成他自己的在到处的讲。
SEO市场细分之五:
SEO软件市场SEO既然已经成为了一个行业,那么伴随着SEO各个环节的工作,很多都是可以用软件来代理人工的,所以必然会有众多的SEO软件市场的需求。有需求,来满足它,然后就可以形成一个新的小行业,对SEO感兴趣,有软件开发能力的,但是不擅长商业化运作的朋友可以与我联系。
SEO市场细分之六:
网页优化市场网页优化是SEO工作的基础工作,不过需求比较大的网页优化不是简单的针对搜索引擎的优化,更重要的是针对用户进行人性化的优化。针对搜索引擎的优化,可以帮助网页在搜索引擎中取得较好的排名,带来较多的潜在客户。但是如果你的网页设计的非常不够人性化的话,这些潜在客户还是不会成为你的客户的。如何让潜在客户快速的称谓你的直接客户,提高你网站流量的转化率呢?那就靠的是对网页进行人性化的优化了。所以,(搜索引擎优化+人性化设计优化)组合到一块儿的网页优化的市场也会逐步的形成。如果你是一个网页设计师,你就赶快在这方面多下点功夫,你这样做了,你就会在以后更容易获得更好的机会。
SEO市场细分之七:
图片、视频文件、域名等构件优化当前此行为还不明朗。实际上域名静态处理上从最初大家都在使用。可这大多是程序实践的。事实上。域名的优化也有很大的空间的。详见我的一篇SEO十步到位法。这三在业内还很少利用并成功实施案例。
SEO市场细分之八:
行业搜索引擎的优化目前,行业搜索引擎越来越多,首先,这些行业搜索引擎想获得流量,除了普通的宣传外,很多程度上也需要靠目前的综合搜索引擎给其带来流量。所以,目前各大行业搜索引擎自身就需要针对各大综合搜索引擎的口味进行SEO。这是一个细分的市场,如果你是搞搜索引擎的,做好这点工作是你的基础。当行业搜索引擎发展到了一定规模,必然会出现针对这些行业搜索引擎的搜索结果而开展的搜索引擎优化工作。这也是一个细分的市场,提前准备,提前受益。只要你把心沉下去,勤奋地实践,认真地观察,每个行业都存在着新的机会!当你创新一个行业,一开始,你就是行业老大!机会永远留给有心的人!
SEO市场细分之九:
目前3G在国内炒的火热朝天,从手机上网到手机QQ聊天我们可以看出,掌上的互联巨大的发展趋势,手机网络的发展势必引起手机网络搜索引擎的快速发展。搜索引擎和搜索引擎优化是形影不离的,3G将是SEOer们下一个春天到来的地方。
五、成为运用搜索引擎的高手
掌握常用的SEO搜索引擎语法不仅能对我们的seo优化工作带来便利,还能把自己打造成一个运用seo来查找知识的高手,下面就是我们常用的十几种语法词汇:
1、intitle:
intitle语法将搜索的范围限制在网页的标题上,intitle:你的关键词
2、allintitle:
他的意思是搜索所有包含关键字的网页。例如我们搜索:“allintitle:武汉seo培训九头鸟seo团队”(注意九头鸟seo团队前面有一个空格),就会搜索到标题中含有“武汉seo培训”,网页中或者标题中含有“九头鸟seo团队”内容的网页。如果不中间不加空格就会搜到“武汉seo培训九头鸟seo团队”全部关键字的网页标题
3、.intext:
intext是搜索网页正文的关键词,这样可以忽略到超链接文本、url和题目。
4、inanchor:
这个语法的意思是在页面的链接锚点进行搜索。链接锚点指一个链接的描述文本,如这样的一段html代码:<aharf="http://www.baidu.com">百度</a>,链接的锚点就是“百度”了,搜索inanchor:百度,就可以搜索到那些含有锚点的网页了
5、site:
这个语法是起限制作用的,即把搜索限制在站点域名范围之内。
6、inurl:
inurl会将搜索的结果限制在url或者网站的页面上,这个语法对于超找搜索和帮助是很有用的,如我们搜索“inurl:admin”
7、link:
link查询的是所有连接到某个特定url上的页面列表。记住了石特定的url页面,如:“link:www.baidu.com”
8、cache:
cache可以帮助用户查找到谷歌索引过多页面副本,他的最大好处就是即使源文件页面不存在了或者说变成了其他内容了我们依然可以找到。
9、filetype:
filetype是搜索指定后缀的文件
10、related:
这个语法是用于查询与某个页面想的网站的,这是辅助搜索同一类别页面的好方法。比喻我们搜索“related:www.google.cn”,得到的几个就是不同搜索引擎的列表。
11、info:
info这个语法可以搜到关于一个url的更多信息的页面列表,这里的信息包括指向到该顶级域名的内容。
12、url'scahed链接:
链接到某个url的所有页面的列表、与某个url相关的页面,已经包含这个url的页面。
第二部分搜索引擎工作原理与优化
第一章搜索引擎到工作原理
第一节 搜索引擎的定义和功能构成
所谓“搜索引擎”,说到底是一个计算机应用软件系统,或者说是一个网络应用软件系统。从网络用户的角度看,它根据用户提交的类自然语言查询词或者短语,返回一系列很可能与该查询相关的网页信息,供用户进一步判断和选取。为了有效地做到这一点,它大致上被分成三个功能模块,或者三个子系统:即网页搜集,预处理和查询服务。
应该指出,在实践中这三个部分是相对独立的,它们的工作形成了搜索引擎工作的三个阶段,通常分别由人工启动。同时我们注意到,在早期的搜索引擎中,系统处理的网页数量少,预处理部分的工作比较简单,只是涉及到汉语的分词(英文还没有这个问题)和建索引,因此也有将分词合并到网页搜集过程中,将建索引归到查询服务子系统中,从而整个系统看起来只有两个模块的安排。
图片一:搜索引擎三段式工作原理模式图
第二节、网页搜集
搜索引擎这样一个软件系统应该是何种工作方式?如果说软件系统是工作在某还是即时。我们都有经验,在网络比较畅通的引擎服务的基础应该是一批预先搜集好的网页个数据集合上的程序的话,这个软件系统操作的数据不仅包括内容不可预测的用户查询,还要包括在数量上动态变化的海量网页,并且这些网页不会主动送到系统来,而是需要由系统去抓取。
首先,我们考虑抓取的时机:事先情况下,从网上下载一篇网页大约需要1秒钟左右,因此如果在用户查询的时候即时去网上抓来成千上万的网页,一个个分析处理,和用户的查询匹配,不可能满足搜索引擎的响应时间要求。不仅如此,这样做的系统效益也不高(会重复抓取太多的网页);面对大量的用户查询,不可能想象每来一个查询,系统就到网上“搜索”一次。
因此我们看到,大规模引擎服务的基础应该是一批预先搜集好的网页(直接或者间接1)。这一批网页如何维护?可以有两种基本的考虑。定期搜集,每次搜集替换上一次的内容,我们称之为“批量搜集”。由于每次都是重新来一次,对于大规模搜索引擎来说,每次搜集的时间通常会花几周。而由于这样做开销较大,通常两次搜集的间隔时间也不会很短(例如早期天网的版本大约每3个月来一次,Google在一段时间曾是每隔28天来一次)。这样做的好处是系统实现比较简单,主要缺点是“时新性”(freshness)不高,还有重复搜集所带来的额外带宽的消耗。
增量搜集,开始时搜集一批,往后只是(1)搜集新出现的网页,(2)搜集那些在上次搜集后有过改变的网页,(3)发现自从上次搜集后已经不再存在了的网页,并从库中删除。由于除新闻网站外,许多网页的内容变化并不是很经常的(有研究指出50%网页的平均生命周期大约为50天,这样做每次搜集的网页量不会很大(例如我们在2003年初估计中国每天有30-50万变化了的网页),于是可以经常启动搜集过程(例如每天)。30万网页,一台PC机,在一般的网络条件下,半天也就搜集完了。这样的系统表现出来的信息时新性就会比较高,主要缺点是系统实现比较复杂;这种复杂还不仅在于搜集过程,而是还在于下面要谈到的建索引的过程。上面讲的是系统网页数据库维护的基本策略。在这两种极端的情况之间也可能有一些折中的方案,J.Cho博士在这方面做过深入的研究[ChoandGarcia-Molina,2000],[Cho,2002],根据一种网页变化模型和系统所含内容时新性的定义,提出了相应优化的网页搜集策略。其中一个有趣的结论是:在系统搜集能力一定的情况下,若有两类网页(例如“商业”和“教育”),它们的更新周期差别很大(例如“商业”类网页平均更新周期是“天”,而“教育”类网页平均更新周期是“月”),则系统应该将注意力放在更新慢的网页上[ChoandGarcia-Molina,2000],以使系统整体的时新性达到比较高的取值。
在具体搜集过程中,如何抓取一篇篇的网页,也可以有不同的考虑。最常见的一种是所谓“爬取”:将Web上的网页集合看成是一个有向图,搜集过程从给定起始URL集合S(或者说“种子”)开始,沿着网页中的链接,按照先深、先宽、或者某种别的策略遍历,不停的从S中移除URL,下载相应的网页,解析出网页中的超链接URL,看是否已经被访问过,将未访问过的那些URL加入集合S。整个过程可以形象地想象为一个蜘蛛(spider)在蜘蛛网(Web)上爬行(crawl)。后面我们会看到,真正的系统其实是多个“蜘蛛”同时在爬。
这种方式的好处除了概念很漂亮,一般实现起来也不困难外,还有很重要的一条是容易通过一定的策略,使搜集到的网页相对比较“重要”。前面提过,任何搜索引擎是不可能将Web上的网页搜集完全的,通常都是在其他条件的限制下决定搜集过程的结束(例如磁盘满,或者搜集时间已经太长了)。因此就有一个尽量使搜到的网页比较重要的问题,这对于那些并不追求很大的数量覆盖率的搜索引擎特别重要。研究表明,按照先宽搜索方式得到的网页集合要比先深搜索得到的集合重要(这里当然有一个重要性的指标问题)。这种方式的一个困难是要从每一篇网页中提取出所含的URL。由于HTML的灵活性,其中出现URL的方式各种各样,将这个环节做得彻底不容易(例如我们现在还没有很好的简单办法从JavaScript脚本中提取URL)。同时,由于Web的“蝴蝶结”形状,这种方式搜集到的网页不大会超过所有目标网页数量2的2/3。
另外一种可能的方式是在第一次全面网页搜集后,系统维护相应的URL集合S,往后的搜集直接基于这个集合。每搜到一个网页,如果它发生变化并含有新的URL,则将它们对应的网页也抓回来,并将这些新URL也放到集合S中;如果S中某个url对应的网页不存在了,则将它从S中删除。这种方式也可以看成是一种极端的先宽搜索,即第一层是一个很大的集合,往下最多只延伸一层。还有一种方法是让网站拥有者主动向搜索引擎提交它们的网址(为了宣传自己,通常会有这种积极性),系统在一定时间内(2天到数月不等)定向向那些网站派出“蜘蛛”程序,扫描该网站的所有网页并将有关信息存入数据库中。大型商业搜索引擎一般都提供这种功能。
第三节、预处理
得到海量的原始网页集合,距离面向网络用户的检索服务之间还有相当的距离。宏观地看,服务子系统是一个程序。采用Wirth关于“程序=算法+数据结构”的观点来考察个程序,一个合适的数据结构是查询子系统工作的核心和关键。这里只是指出:现行最有效的数据结构是“倒排文件”(invertedfile);倒排文件是用文档中所含关键词作为索引,文档作为索引目标的一种结构(类似于普通书籍中,索引是关键词,书的页面是索引目标)。我们在第八章中有进一步分析。下面讨论从网页集合形成这样的倒排文件过程中的几个主要问题,即我们所说的“预处理”。主要包括四个方面,关键词的提取,“镜像网页”(网页的内容完全相同,未加任何修改)或“转载网页”(near-replicas,主题内容基本相同但可能有一些额外的编辑信息等,转载网页也称为“近似镜像网页”)的消除,链接分析和网页重要程度的计算。
1.关键词的提取
随便取一篇网页的源文件(例如通过浏览器的“查看源文件”功能),我们可以看到其中情况纷乱繁杂。除了我们从浏览器中能够正常看到的文字内容外,还有大量的HTML标记。根据天网统计,网页文档源文件的大小(字节量)通常大约是其中内容大小的4倍(例如http://net.pku.edu.cn就是如此!)。另外,由于HTML文档产生来源的多样性,许多网页在内容上比较随意,不仅文字不讲究规范、完整,而且还可能包含许多和主要内容无关的信息(例如广告,导航条,版权说明等)。这些情况既给有效的信息查询带来了挑战,也带来了一些新的机遇,在后面的章节将会有进一步的论述。这里我们只是指出,为了支持后面的查询服务,需要从网页源文件中提取出能够代表它的内容的一些特征。从人们现在的认识和实践来看,所含的关键词即为这种特征最好的代表。于是,作为预处理阶段的一个基本任务,就是要提取出网页源文件的内容部分所含的关键词。对于中文来说,就是要根据一个词典Σ,用一个所谓“切词软件”,从网页文字中切出Σ所含的词语来。在那之后,一篇网页主要就由一组词来近似代表了,p={t1,t2,…,tn}。一般来讲,我们可能得到很多词,同一个词可能在一篇网页中多次出现。从效果(effectiveness)和效率(efficiency)考虑,不应该让所有的词都出现在网页的表示中,要去掉诸如“的”,“在”等没有内容指示意义的词,称为“停用词”(stopword)。这样,对一篇网页来说,有效的词语数量大约在200个左右。
2.重复或转载
网页的消除与生俱来的数字化和网络化给网页的复制以及转载和修改再发表带来了便利,因此我们看到Web上的信息存在大量的重复现象。天网在2003年的一次大规模统计分析表明,网页的重复率平均大约为4。也就是说,当你通过一个URL在网上看到一篇网页的时候,平均还有另外3个不同的URL也给出相同或者基本相似的内容。这种现象对于广大的网民来说是有正面意义的,因为有了更多的信息访问机会。但对于搜索引擎来说,则主要是负面的;它不仅在搜集网页时要消耗机器时间和网络带宽资源,而且如果在查询结果中出现,无意义地消耗了计算机显示屏资源,也会引来用户的抱怨,“这么多重复的,给我一个就够了”。因此,消除内容重复或主题内容重复的网页是预处理阶段的一个重要任务。
3.链接分析
前面提到,大量的HTML标记既给网页的预处理造成了一些麻烦,也带来了一些新的机遇。从信息检索的角度讲,如果系统面对的仅仅是内容的文字,我们能依据的就是“共有词汇假设”(sharedbagofwords),即内容所包含的关键词集合,最多加上词频(termfrequency或tf、TF)和词在文档集合中出现的文档频率(document requency或df、DF)之类的统计量。而TF和DF这样的频率信息能在一定程度上指示词语在一篇文档中的相对重要性或者和某些内容的相关性,这是有意义的。有了HTML标记后,情况还可能进一步改善,例如在同一篇文档中,<H1>和</H1>之间的信息很可能就比在<H4>和</H4>之间的信息更重要。特别地,HTML文档中所含的指向其他文档的链接信息是人们近几年来特别关注的对象,认为它们不仅给出了网页之间的关系,而且还对判断网页的内容有很重要的作用。例如“北大学报”这几个字在北京大学学报社会科学版的主页上是没有的,因此一个仅靠内容文字分析的搜索引擎就不可能返回该主页作为结果。但是北京大学主页上是用“北大学报(社)”作为链接信息指向了北京大学学报社会科学版的主页。因此在很好利用链接信息的搜索引擎中应该能返回北京大学学报社会科学版的主页。
4.网页重要程度的计算
搜索引擎返回给用户的,是一个和用户查询相关的结果列表。列表中条目的顺序是很重要的一个问题。由于面对各种各样的用户,加之查询的自然语言风格,对同样的“关键词”返回相同的列表肯定是不能使所有提交“关键词”的用户都满意的(或者都达到最高的满意度)。因此搜索引擎实际上追求的是一种统计意义上的满意。人们认为Google目前比天网好,是因为在多数情况下前者返回的内容要更符合用户的需要,而不是所有情况下都如此。如何对查询结果进行排序有很多因素需要考虑,后面将有深入的讨论。这里只是概要解释在预处理阶段可能形成的所谓“重要性”因素。顾名思义,既然是在预处理阶段形成的,就是和用户查询无关的。如何讲一篇网页比另外一篇网页重要?人们参照科技文献重要性的评估方式,核心想法就是“被引用多的就是重要的”。“引用”这个概念恰好可以通过HTML超链在网页之间体现得非常好,作为Google创立核心技术的PageRank就是这种思路的成功体现[Page,etal.,1998]。除此以外,人们还注意到网页和文献的不同特点,即一些网页主要是大量对外的链接,其本身基本没有一个明确的主题内容,而另外有些网页则被大量的其他网页链接。从某种意义上讲,这形成了一种对偶的关系,这种关系使得人们可以在网页上建立另外一种重要性指标[Kleinberg,1998]。这些指标有的可以在预处理阶段计算,有的则要在查询阶段计算,但都是作为在查询服务阶段最终形成结果排序的部分参数。
第四节、查询服务
如上述,从一个原始网页集合S开始,预处理过程得到的是对S的一个子集的元素的某种内部表示,这种表示构成了查询服务的直接基础。对每个元素来说,这种表示至少包含如下几个方面:
原始网页文档
URL和标题
所含的重要关键词的集合(以及它们在文档中出现的位置信息)
其他一些指标(例如重要程度,分类代码等)而系统关键词总体的集合和文档的编号一起构成了一个倒排文件结构,使得一旦得到一个关键词输入,系统能迅速给出相关文档编号的集合输出。然而,如同我们在前面提到的,用户通过搜索引擎看到的不是一个“集合”,而是一个“列表”。如何从集合生成一个列表,是服务子系统的主要工作。从搜索引擎系统功能划分的角度,有时候将倒排文件的生成也作为服务子系统的一部分功能,但我们这里将它划分到预处理阶段中觉得更方便些。换句话讲,服务子系统是在服务进行的过程中涉及的相关软件程序,而为这些软件程序事先准备数据的程序都算在预处理子系统中。下面来看对服务子系统的要求和其工作原理,主要有三个方面。
1.查询方式和匹配查询方式指的是系统允许用户提交查询的形式。考虑到各种用户的不同背景和不同的信息需求,不可能有一种普适的方式。一般认为,对于普通网络用户来说,最自然的方式就是“要什么就输入什么”。但这是一种相当模糊的说法。例如用户输入“北京大学”,可能是他想了解北京大学目前有些什么信息向外发布,想看看今年的招生政策(于是希望看的是北大网站上的内容),也可能是他想了解外界目前对北京大学有些什么评价(于是希望看到的是其他权威网站上关于北大的消息)。这是两种相当不同的需求。在其他一些情况下,用户可能关心的是间接信息,例如“喜马拉雅山的高度”,8848米应该是他需要的,但不可能包含在这短语中。而用户输入“惊起一滩鸥鹭”则很可能是想知道该词的作者是谁,或者希望能提醒前面几句是什么。尽管如此,用一个词或者短语来直接表达信息需求,希望网页中含有该词或者该短语中的词,依然是主流的搜索引擎查询模式。这不仅是因为它的确代表了大多数的情况,还因为它比较容易实现。这样,一般来讲,系统面对的是查询短语。就英文来说,它是一个词的序列;就中文来说,它是包含若干个词的一段文字。一般地,我们用q0表示用户提交的原始查询,例如,q0=“网络与分布式系统实验室”。它首先需要被“切词”(segment)或称“分词”,即把它分成一个词的序列。如上例,则为“网络与分布式系统实验室”(注意,不同的分词软件可能得出不同的结果,这里用的是北大计算语言所的在线分词软件)。然后需要删除那些没有查询意义或者几乎在每篇文档中都会出现的词(例如“的”),在本例中即为“与”。最后形成一个用于参加匹配的查询词表,q={t1,t2,…,tm},在本例中就是q={网络,分布式,系统,实验室}。前面讲过,倒排文件就是用词来作为索引的一个数据结构,显然,q中的词必须是包含在倒排文件词表中才有意义。有了这样的q,它的每一个元素都对应倒排文件中的一个倒排表(文档编号的集合),记作L(ti),它们的交集即为对应查询的结果文档集合,从而实现了查询和文档的匹配。上述过程的基本假设是:用户是希望网页包含所输入查询文字的。
2.结果排序上面,我们了解了得到和用户查询相关的文档集合的过程。这个集合的元素需要以一定
的形式通过计算机显示屏呈现给用户。就目前的技术情况看,列表是最常见的形式(但人们也在探求新的形式,如Vivisimo引擎将结果页面以类别的形式呈现)。给定一个查询结果集合,R={r1,r2,…,rn},所谓列表,就是按照某种评价方式,确定出R中元素的一个顺序,让这些元素以这种顺序呈现出来。笼统地讲,ri和q的相关性(relevance)是形成这种顺序的基本因素。但是,有效地定义相关性本身是很困难的,从原理上讲它不仅和查询词有关,而且还和用户的背景,以及用户的查询历史有关。不同需求的用户可能输入同一个查询,同一个用户在不同的时间输入的相同的查询可能是针对不同的信息需求。为了形成一个合适的顺序,在搜索引擎出现的早期人们采用了传统信息检索领域很成熟的基于词汇出现频度的方法。大致上讲就是一篇文档中包含的查询(q)中的那些词越多,则该文档就应该排在越前面;再精细一些的考虑则是若一个词在越多的文档中有出现,则该词用于区分文档相关性的作用就越小。这样一种思路不仅有一定直觉上的道理,而且在倒排文件数据结构上很容易实现。因为,当我们通过前述关键词的提取过程,形成一篇文档的关键词集合,p={t1,t2,…,tn}的时候,很容易同时得到每一个ti在该文档中出现的次数,即词频,而倒排文件中每个倒排表的长度则对应着一个词所涉及的文档的篇数,即文档频率。然而,由于网页编写的自发性、随意性较强,仅仅针对词的出现来决定文档的顺序,在Web上做信息检索表现出明显的缺点,需要有其他技术的补充。这方面最重要的成果就是前面提到过的PageRank。通过在预处理阶段为每篇网页形成一个独立于查询词(也就和网页内容无关)的重要性指标,将它和查询过程中形成的相关性指标结合形成一个最终的排序,是目前搜索引擎给出查询结果排序的主要方法。
3.文档摘要搜索引擎给出的结果是一个有序的条目列表,每一个条目有三个基本的元素:标题,网址和摘要。其中的摘要需要从网页正文中生成。一般来讲,从一篇文字中生成一个恰当的摘要是自然语言理解领域的一个重要课题,人们已经做了多年的工作并取得了一些成果。但相关的技术用到网络搜索引擎来有两个基本困难。一是网页的写作通常不规范,文字比较随意,因此从语言理解的角度难以做好好;二是复杂的语言理解算法耗时太多,不适应搜索引擎要高效处理海量网页信息的需求。我们做过统计,即使是分词这一项工作(文本理解的基础),在高档微机上每秒钟也只能完成10篇左右网页的处理。因此搜索引擎在生成摘要时要简便许多,基本上可以归纳为两种方式,一是静态方式,即独立于查询,按照某种规则,事先在预处理阶段从网页内容提取出一些文字,例如截取网页正文的开头512个字节(对应256个汉字),或者将每一个段落的第一个句子拼起来,等等。这样形成的摘要存放在查询子系统中,一旦相关文档被选中与查询项匹配,就读出返回给用户。显然,这种方式对查询子系统来说是最轻松的,不需要做另外的处理工作。但这种方式的一个最大的缺点是摘要和查询无关。一篇网页有可能是多个不同查询的结果,例如当用户分别查询“北大计算机网络”和“北大分布式系统”,我们实验室的主页http://net.pku.edu.cn在两种情况下应该都作为结果返回。当用户输入某个查询,他一般是希望摘要中能够突出显示和查询直接对应的文字,希望摘要中出现和他关心的文字相关的句子。因此,我们有了“动态摘要”方式,即在响应查询的时候,根据查询词在文档中的位置,提取出周围的文字来,在显示时将查询词标亮。这是目前大多数搜索引擎采用的方式。为了保证查询的效率,需要在预处理阶段分词的时候记住每个关键词在文档中出现的位置。
除上述外,查询服务返回的内容还有一些细节的支持。例如,对应一个查询往往会有成千上万的结果,返回给用户的内容通常都是按页组织的,一般每页显示10个结果。统计表明[Wang,etal.,2001],网络用户一般没有耐心一页页看下去,平均翻页数小于2。这告诉我们将第一页的内容组织好非常重要。如果希望用户多用搜索引擎,就要让第一页的内容尽量有吸引力。
第五节、用户从谷歌搜索到接受答案的全过程
图片二谷歌查询声明周期示意图
参阅:谷歌搜索原理介绍
第二章搜索引擎优化
第一节、什么是搜索引擎优化
1、WIKI定义
SEO是Search Engine Optimization的缩写,用英文描述就是to usesometechnics to you’re your website in the to pplacesin Search Engine when somebody is using Search Engine to find something,翻译成中文就是“搜索引擎优化”,一般可简称为搜索优化。
SEO的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。
2、国内的一些解释搜索引擎优化是搜索引擎营销的常见形式之一。根据《网络营销基础与实践》(第2版)第4章“搜索引擎营销基础”中的相关内容,所谓搜索引擎优化,也就是针对各种搜索引擎的检索特点,让网页设计适合搜索引擎的检索原则(即搜索引擎友好),从而获得搜索引擎收录并在排名中靠前的各种行为。如对于基于META标签检索的搜索引擎,在META标签中设置有效的关键词和网站描述,对于以网页内容相关性为主的蜘蛛型搜索引擎,则通过在网页中增加关键词的密度,或者专门为搜索引擎设计一个便于检索的页面(如sitemap.htm、roberts.txt)。
搜索引擎优化是一个优秀的网络营销工具,他是搜索引擎营销的的基础元素。这个工具是基于搜索引擎对网页的收录、预处理和排序这三个阶段的复杂工艺而作用在我们的网页和网页内容的优化上的。通过合理的运用这个工具我们能够真的搜索引擎做众多的有利于关键词广告的质优价低、有利于网站的良好排名、有利于网络负面信息的清扫、有利于提高在搜索引擎寻找资料的效率……,其实搜索引擎就是一个改善我们基于搜索引擎众多生活问题、业务问题、和投资回报问题的优秀工具。
第二节、搜索引擎优化的特色
1、自然结果商机更大
从搜索习惯来看,用户更倾向于点击查看自然排名的结果。各大搜索引擎都很好的区分了自然排名结果和广告,比如Google仅仅把广告显示在右侧,左侧全是自然排名结果,百度也在广告结果中加入了“推广”的字样。一般用户对广告都有一定的排斥,一旦他们分辨出哪些是广告,就会尽量不去点击。所以,如果企业的网站出现在在自然排名中,就会加大被用户点击的可能性,从而带来更多的商业机会。
2、节省费用
网站通过实施搜索引擎优化,可以使一些关键词的排名提高。而此前如果希望通过这些关键词带来潜在客户,则需要不断地投放广告。这无疑为企业节省了一定的广告开支。即便企业不去削减广告预算,也大可以把这些费用投放在更多的关键词上。
3、全面覆盖
随着搜索技术的发展,越来越多的搜索引擎出现了。但是企业不可能在所有的搜索引擎针对所有的相关内容都投放广告,况且还有一些搜索引擎暂时不提供收费的广告业务。因此,只有根据搜索引擎的普遍规律去优化网站,才有可能做到对搜索引擎更多的覆盖。
4、更好的用户体验
正确的搜索引擎优化并不会为了迎合搜索引擎而把网站改得面目全非,相反,优化会遵循“用户喜欢的才是搜索引擎喜欢的”这一基本观点,去充分考虑用户的体验。
第三节、搜索引擎优化和网站优化的区别
现在搜索引擎优化成为网络营销领域的热点概念之一,但对于搜索引擎优化的概念本身还存在一些模糊的认识,有些将搜索引擎优化等同于google排名,有些则将搜索引擎优化与网站优化混为一谈,其实这些概念之间并不是一回事。通过上面的课程学习我们知道,所谓搜索引擎优化(SearchEngineOptimization,SEO),也就是针对各种搜索引擎的检索特点,让网页设计适合搜索引擎的检索原则(即搜索引擎友好),从而获得搜索引擎收录并在排名中靠前的各种行为。可见google排名只是搜索引擎优化的一个具体应用,并不是搜索引擎优化的全部,而且,这里所说的搜索引擎优化是指用规范的(搜索引擎规则范围之内的)手段来改善网站搜索引擎可见性和友好性的行为,对于采用欺骗手段获得在google检索结果种好的排名(正如一些垃圾SEO所从事的google排名业务那样)并不等同于搜索引擎优化。
我们认为,搜索引擎优化是网站搜索引擎推广的一种指导思想,其基础是对搜索引擎友好的网站结构和内容等基本要素进行优化设计,因此搜索引擎优化与网站优化是密切相关的,但两者并不完全是一回事。根据作者对网站策划建设、运营维护,以及为了网站推广的目的进行搜索引擎优化的体会,总结出有关网站优化的基本思想是:通过对网站功能、结构、布局、内容等关键要素的合理设计,使得网站的功能和表现形式达到最优效果,可以充分表现出网站的网络营销功能。
网站优化设计的含义具体表现在三个方面:
(1)从用户的角度来说,经过网站的优化设计,用户可以方便地浏览网站的信息、使用网站的服务;
(2)从基于搜索引擎的推广网站的角度来说,优化设计的网站使得搜索引擎则可以顺利抓取网站的基本信息,当用户通过搜索引擎检索时,企业期望的网站摘要信息可以出现在理想的位置,使得用户能够发现有关信息并引起兴趣,从而点击搜索结果并达到网站获取进一步的信息的服务,直至成为真正的顾客;
(3)从网站运营维护的角度来说,网站运营人员则可以对网站方便地进行管理维护,有利于各种网络营销方法的应用,并且可以积累有价值的网络营销资源,因为只有经过网站优化设计的企业网站才能真正具有网络营销导向,才能与网络营销策略相一致。
由此可见,网站优化包括三个层面的含义:对用户优化、对网络环境(搜索引擎等)优化,以及对网站运营维护的优化。
网站设计对用户优化的具体表现是:以用户需求为导向,设计方便的网站导航,网页下载速度尽可能快,网页布局合理并且适合保存、打印、转发,网站信息丰富、有效,有助于用户产生信任;
网站设计对网络环境优化的表现形式是:适合搜索引擎检索(搜索引擎优化),便于积累网络营销网站资源(如互换链接、互换广告等);
网站设计对运营维护优化的含义是:充分体现网站的网络营销功能,使得各种网络营销方法可以发挥最大效果,网站便于日常信息更新、维护、改版升级,便于获得和管理注册用户资源等。
从上述对网站优化设计含义的理解也可以看出,网站优化设计并非只是搜索引擎优化,搜索引擎优化只是网站优化设计中的一部分,之所以很容易将网站优化等同于搜索引擎优化,主要原因在于网站设计因素对搜索引擎优化状况的影响非常明显和直接,因此更容易引起重视。同时应注意的是,网站设计优化不仅仅是为了搜索引擎优化,其核心仍然是对用户的优化,因此应坚持用户导向而不是搜索引擎导向,这也是网站优化与搜索引擎优化基本思想的重要区别支出。
网站优化基本思想种之所以强调坚持以用户为导向的原则,是因为网站的内容和服务是否有价值最终是由用户来判断的,即使网站在搜索引擎中的表现很好,如果用户使用感觉很不方便,同样不会产生理想的效果。而且,网站推广也并非完全依赖搜索引擎,还需要综合考虑各种相关因素。因此网站优化设计中三个层面的内容不能顾此失彼,应实现全面优化,尤其是对用户的优化应放在首位。
第四节、搜索引擎优化和搜索引擎营销的关系
1.搜索引擎优化:
2.搜索引擎营销:
第五节、优秀搜索引擎优化工作人员应具备的品质
SEO培训能吸引越来越多的人的原因在于seo行业和搜索引擎的近亲关系和网络巨大的推广力量。那么想成为一个杰出的seoer我们应该做具备哪些特定条件呢,或者说想成为一个出色的seo从业人员我们应该具备哪些素质?
1杰出的seoer要信心十足
SEO是网络营销的最重要得工具之一,我们在武汉SEO疯狂训练营所需要学习的各种seo技术,都是九头鸟seo团队的专家们在实战中总结得出来的,对网站优化都有莫大的帮助。当你在用这些方法进行工作的时候不要急燥,我们服务的很多客户都是用这些方法来做的,你也可以,要对自己有信心。
2杰出的seoer要耐力持久
做seo不是一朝一夕的事情,所以这就要求我们要有耐力、耐心。我们毕竟不是搜索引擎,我们不可能控制所有网站的收录和排名提升速度,但是我们有的是坚持的韧劲。只要我们对我们的网站持久不断的进行优化,再差的网站都会有好的收录和排名的。我们身边经常有这样的例子,很多网站我们做了优化很长时间都没有好的排名然后放弃了,结果我们过段时间再回头看的时候,切发现这个网站的收录和排名都都不错了,呵呵,有心栽树树不发,无心插柳柳成荫!坚持!
3杰出的seoer怎么能缺少细心
SEO涉及到网站内外的方方面面,因素很多,在遇到问题的时候,要仔细根据现象将全部的可能都要想到,针对每个进行深入分析,这样才能解决问题。比喻nofollow等标签的运用。
4杰出的seoer更需要虚心搜索引擎在不断的更新算法,以便使搜索结果更加符合用户的搜索要求。所以在算法调整以后可能我们以前的方法或者技术已经落后了。这个时候我们要不断的去学习,进行虚心求教。
5.杰出的seoer要有创造性
我们说seo不仅仅是一种技术,我们现在强调的更多的是策略,那么好的策略就需要我们的seoer具有创造有利战略方针的本领,能过对我们的优化问题作出宏观的分析,首先在战略上战胜对手。另外创造性还在于网站和的运营理念的设计,关键词的选择定位等。
第三章谷歌PR值
第一节、来自谷歌官方的PR定义
1.PageRank是以Google的创始人LarryPage的姓来命名的,它是Google排名运算法则(网页排名)的一部分,用来标识网页的等级/重要性。级别从1到10,PR值越高说明该网页越受欢迎(越重要)。
2.PageRank会通过解析一个具有5亿多个变量和20亿个条件的方程,对网页的重要性进行客观的测定。PageRank会将网页A上指向网页B的链接解释为由网页A对网页B所投的一票,而不是计算直接的链接数。这样,PageRank根据网页收到的投票数来评估其重要性。
第二节、PR值计算公式和实际PR值
1、PR的计算公式
这是经典的求PR方程式。它通过解决包括Google索引的以数十亿计的每页网页在内的方程式而得到结果。
图片五PR值计算公式从上面的公式我们就能很轻松的看出来:1.我们的外链要越多越好2.我们外链的PR值要越高越好。那么是不是网站的PR值越高我们的网站排名就一定越好呢?请看下一节内容
2、工具条上的PR值和实际PR值
图片六工具条上的pr值和实际的pr值
从上图我们可以看出,谷歌工具条上的pr值其实是网页的权重级别,而不是实际的pr数值。网站的级别是按照几何指数来递增的,相邻两个级别之间随着级别的增加而差距越大,升级到下一级也就变得更加困难。
根据这个图表显示的问题我们就可以解决很多实质性的问题,比如一个链出很少PR4比如10个和一个PR6链出很多比如100个的网页相比较,我们还是连接PR=6的比较划算,因为按照上面的公式计算从PR=4的网页带给我们的权重是1000/10=100而PR=6的网页给我们带来的权重值是100000/100=1000,很明显pr高的给我们带来的pr值也高。
从另外一个角度来讲,在上面介绍环境下,10个PR=4的外链才能低得上一个PR=6的外链给我们带来的权重,所以我们和更多低pr的值的外链将比一个高质量的pr有效。比如说10000个pr=1的网页给我们带来的pr值将比一个pr=4的网页给我们带来的pr值数多。
3.谷歌评价pr时会考虑网页相关性
PageRank也会考虑发出投票的每个网页的重要性,也就是某些网页的投票具有的价值较大,为该链接的页面赋予的价值因而也就较大。重要的网页会得到较高的PageRank,并出现在搜索结果的顶部。Google的技术是利用网络中的综合信息来确定网页的重要性。因为没有人工干涉,也不对结果进行操纵,所以用户一直信任Google是一个不会因付费而影响排名的客观信息来源。
第三节、影响网页PR的因素和提高网站PR值的方法
通过上面的内容我们知道影响网页pr值的高低有三大因素,他们分别是:
1.网页链接数量的多少
2.链接对应网页的pr值高低
3.链接对应网页的内容相关性。那么我们要想提高一个网站的pr值就必须有针对性的去努力。
为了提高网页的pr值我们可以做哪些工作呢?
1.找众多高质量的相关网站交换链接
2.将你的网站提交到DMOZ等众多的分类目录
3.创建更多的内容来丰富你的网站页面
4.编写更多高质量的文章,通过让人们转载或者群发来增加网页的被引用
第四节、PR值对网页排名的影响
PR只是谷歌对网页质量高低的一种评判指标,也许在谷歌幼年的时候他对网站的排名十分有用,但是随着谷歌成长影响谷歌结果排序的因素越来越多,PR的重要程度已经将得很低了。网页有高的pr值说明这个网页权重很高,受到谷歌蜘蛛的尊重,但是这并不意味着pr值高的网页就一定能有很好的排名。我们经常会看到那些PR值很低(甚至为0)的网站排名相当好。
第三部分网站优化技术基础
第四章 网站优化的定义
通俗的来讲,网站优化分为两个部分,一是站内优化,二是站外优化。站内优化就是通
过seo手段使得我们的网站在搜索引擎友好度和站内用户体验度方面有出色的表现。这样做的目的很简单,就是为了让我们的网站在搜索引擎的排名靠前、获得更多流量并且将得到得浏览者很好的发展为有效客户。站外优化呢?他是通过seo手段帮助网站和网站所属企业进行营运模式和网络的匹配以及品牌推广,这个过程可能涉及到的方式有百度竞价、谷歌广告、博客营销、论坛营销等方式。
第五章 选择主机
第一节、虚拟主机
现在许多小型企业网站都采用虚拟主机的方式。虚拟主机是使用特殊的软件技术,把台网站服务器划分为若干个“虚拟”的主机。每个虚拟主机都可以是一个独立的网站,可以具有独立的域名,具有完整的Internet服务器功能(WWW、FTP、Email等),同一台主机上的虚拟主机之间是完全独立的。从网站访问者来看,每一台虚拟主机和一台独立的主机(采用服务器托管、专线上网等方式建立的服务器)完全一样。
用虚拟主机建设网站具有下列优点:
(1)相对于购买独立服务器,租空间的费用大大降低,为普及中小型网站提供了极大便利;
(2)网站服务器服务器管理简单,诸如软件配置、防病毒、防攻击等安全措施都由专业服务商提供,大大简化了服务器管理的复杂性;
(3)网站建设效率提高,自己购买服务器到安装操作系统和应用软件需要较长的时间,而租用虚拟主机通常只需要几分钟的时间就可以开通,因为现在主要的服务商都已经实现了整个业务流程的电子商务化,选择适合自己需要的虚拟主机,在线付款之后马上就可以开通了。
以上是虚拟主机的优点,当然虚拟主机也有的适用范围的,有些方面也存在缺点,比如:
(1)某些功能受到服务商的限制,比如可能耗用系统资源的论坛程序、流量统计功能等;在网站静态化时,通常不能使用IIS_Rewrite动态库,只能使用404错误转发处理,使工作量增加。
(2)网站设计需要考虑服务商提供的功能支持,比如数据库类型、操作系统等;
(3)某些虚拟主机网站访问速度过慢,这可能是由于主机提供商将一台主机出租给数量众多的网站,或者服务器配置等方面的原因所造成的,这种状况网站自己无法解决,对于网站的正常访问会产生不利影响;另外如果该主机上有被搜索引擎惩罚的网站,将对你网站的排名带来潜在风险。
可通过下列工具查看该IP(虚拟空间)下有多少个网站:
登录http://indexed.linkhelper.cn/sameip.asp查询,显示全部域名。其实这样的工具很多,在我们的工具包里面都有
第二节、服务器托管
服务器托管是指为了提高网站的访问速度,将您的服务器及相关设备托管到具有完善机房设施、高品质网络环境、丰富带宽资源和运营经验以及可对用户的网络和设备进行实时监控的网络数据中心内,以此使系统达到安全、可靠、稳定、高效运行的目的。托管的服务器由客户自己进行维护,或者由其它的授权人进行远程维护。数据中心可以为客户的关键服务器提供机柜及带宽出租服务,使服务器可维持每星期七日、全日二十四小时无休止服务。当您有意建设自己的Web、Email、Ftp服务器,而您的网站的应用很复杂或您网站的访问率很高时,您可以选择自已购买服务器,进行整机托管。托管的服务器在SEO优化过程中将更灵活,体现在以下方面:
可以自由选择网站静态化策略。
可以查看IIS服务详细日志。
有利于搜索引擎更快的抓取页面。
影响主机的其他因素:比如做一些高风险的关键词,比如:六合彩,在国内是禁止的。但在香港是合法的,如果在国内做这样的关键词,很可能被封IP,这个时候就需要使用香港或者国外的服务器主机了。但如果做的关键词是国家严格禁止的,比如法轮功等,无论网站在何地,都将被屏蔽。
第三节、虚拟专用服务器(VPS)
虚拟专用服务器是利用VPS(VirtualPrivateServer)技术,将一部服务器分割成多个虚拟专享服务器的优质服务。每个 VPS都可分配独立公网 IP地址、独立操作系统Windows/Linux、独立超大空间、独立内存、独立CPU资源、独立执行程序和独立系统配置等。用户除了可以分配多个虚拟主机及无限企业邮箱外,更拥有独立服务器功能,可自行安装程序,自主重启服务器。VPS在SEO优点:同托管服务器类似,同样灵活。
VPS的缺点:
1.虚拟内存受限制,当内存占用稍大,就会出现http1.1和错误。
2.需要客户对服务器系统安装配置等等都非常熟悉,否则容易引起软件故障。
第四节、国外主机
对做海外业务的公司建议选择国外主机,有下列好处:
1.国外的网络速度比国内的要快很多,将使你的网站能够更快的展现给用户,提高用户的体验度。
2.Google对国外的网站有比较高的权重。国外很多机构的网站PR在8以上,而国内流量很大的新浪、百度PR才8。
3.国内很多服务器(虚拟主机)供应商对垃圾邮件发送者管理不严,国内ip地址又极度缺乏。因为你的邮件和网站放置的空间上是多用户(虚拟主机)共享一个ip地址。其它人滥发垃圾邮件,造成国外反垃圾邮件组织和国外提供虚拟主机商对这一ip地址屏蔽。影响了你正常的E-Mail通讯。而国外的服务器对此管理相对较严格,能够保证你正常的E-mail通信。
4.国外对某些行业政策比较宽松。
第五节、主机转移
如果你想转移网站的主机服务,要在取消原来的服务提供商之前,先找好新的供应商。
先在新的服务商处开个帐号,确保所有的文件都正确无误地传到新服务器上。网站在新服务器上运行无碍后再联系你的原供应商,告知对方将终止合作,但确保他们不会马上关你的网站。再联系你的域名注册商(可能是原主机提供商),变更域名服务器(DNS)。域名服务器的功能就是把你的域名解析成计算机能够识别的IP地址。把旧的域名服务器改成新的,这个过程到生效时间大概24-48 小时之内,少数情况下可能要72 小时。这期间,如果一个搜索引擎刚好来抓你的网页,要么抓到旧的IP地址上的网站,要么抓到新的域名解析生效后的网站,总之都不会出现网站打不开的空档。
第六节、稳定支持
无论选择何种服务器,都一定要保证服务器能够稳定运行。如果网站在几天内都打不开将严重影响到关键词排名,甚至可能被搜索引擎认为该网站已经不存在而从索引库中删除。
第七章选择域名
域名是网站的基础,一个好的域名对于网站的意义是不言而喻的。
第一节、域名及网站名称
域名,是人们进入互联网时对其相应网站的第一印象。如果别人看到您的域名就会联想到这是一个什么样的网站、突出的主题、所在的行业和地区;第一步便是成功的。如果该域名更具有简洁、明了、好记、含义深刻的特点,可以肯定这必是一个好的域名。
好的域名及网站标准:
1.通过域名就可以想起网站名称,记得网站名称就可以输入域名。比较好的例子:百度www.baidu.com,域名就是中文名称的拼音,非常容易记忆,而且输入也非常方便。较差的例子:帖易 www.teein.com, 域名是英文的组合,我知道这个网站有一年多了,每次都输错,不得不在百度里面查询。
2.字符不要太长,最好在6个以内,这样比较容易记忆。
3.域名中的字符最好少出现远离键盘中心的字母,比如:z、x等。这样用户输入起来比较方便。
4.域名中的字符最好少出现多音节的字母,比如:w、x等。当你向别人介绍你的域名的时候,读起来会很拗口。
域名查询:中国万网http://www.net.cn/
第二节、域名及网站名称中的关键词
域名中的关键词虽然为网站排名加分影响不是很大,但有条件的最好在域名中能够出现关键词。如果是英文,多个关键词之间要使用短横线“-”来分隔,不要使用下划线“_”。短横线隔开后的关键词组还可以获得更多的词组搜索结果,如www.madeinchina.com 被认为只有一个词madeinchina,而made-in-china则被看作正常的madeinChina词组。
网站名称中出现关键词对排名影响很大,而且关键词出现的越靠前,作用越大。通常首页的标题就是网站的名称,在进行友情链接时就相当于为你的核心关键词作了外部链接。比较好的例子:九头鸟seo团队官方网站 www.wh-seo.com,网站核心关键词:武汉seo培训。
第三节、域名后缀
域名后缀有很多,通常是.com,.com.cn,.cn,.org,.net等。业内认为:在同等情况下,代表非商业性网站的后缀.org和.net有着比.com更高的排名优势;对中文网站来说,表示中国域的.cn和.com.cn 又比无地区性的.com有一定优势。
从用户角度来看:用户记住一个域名,通常是主域名,后缀默认的认为是.com,所以不论注册了多少个后缀,一点切记要把.com后缀注册上,避免流量丢失。
反面的例子:胜龙科技 www.shenglong.com.cn 是做证券分析业务的网站。而后缀为.com.cn的域名www.shenglong.com没有注册而被别人抢注,不仅对公司形象有一定的影响,如果被竞争对手获得,那将严重影响你的业务。比如hao123网址之家的.cn域名被别人注册去了,也模仿hao123做了网址导航站,他每天要从hao123.com分走大量的ip。
第四节、过期域名
也许你曾经有这样的困惑,刚刚申请的域名,做好的网站,可搜索引擎就是不收录,这是什么原因呢?这是因为这个域名以前被人使用过,由于作弊被搜索引擎删除,所以放弃续费导致域名过期,结果被你重新注册。
域名过期是指域名到期后仍未续费,注册机构将域名暂停、DNS也停止解析、网站无
法无法访问的状况。具体情况如下:
1.国际域名到期后仍未办理续费,域名暂停、DNS停止解析、网站无法访问,对其进行续费后,经过1-2个工作日,可恢复解析。
2.国内域名到期后仍未办理续费,cnnic会将您的域名暂停、DNS停止解析,网站无法访问,对其进行续费后,经过2-3个工作日,可恢复解析。
3.域名失效:国际域名到期后,30天内未办理续费,域名将失效。国内域名到期后,15天内未办理续费,域名将失效。
第五节、利用过期域名进行优化
过期域名并不都是因为作弊而放弃续费的,里面有很多因为网站的工作人员疏忽或者网站倒闭导致域名没有及时续费。重新找回丢失的域名将会花费很大成本和精力。所以要及时为自己的域名续费。
实例:www.jeep.cn原属北京吉普汽车有限公司,后因过期被深圳市百酷科技有限公司抢注。www.FM365.com属联想集团,后被265.com站长蔡文胜抢注成功。某些过期域名
具有很高价值,比如:某网站由于经营不善导致关门,域名自然没有人续费面临过期,而在网站推广的过程中建立的大量的外部链接,在搜索引擎中收录的页面很多,PR值很高,此域名具有很大的价值,如果此域名业务和你的业务相同,那你在搜索引擎推广方面已经事半功倍了。如果不小心注册了被搜索引擎屏蔽的域名请参见:搜索引擎对作弊的处罚中重新申请加入的内容。过期域名查询工具:易名中国http://www.ename.cn/DoMainFind.jsp
第六节、域名注册
域名注册后,此域名才能真正的属于你!域名注册步骤:
1.查询此域名是否可以注册?
中国万网http://www.net.cn/还有39互联、59互联、八方互联、新网等大批域名服务商。
2.在搜索引擎里查询此域名是否使用过?方法:以www.ttscj.com为例
百度搜domain:www.ttscj.comhttp://www.baidu.com/s?wd=domain%3Awww.ttscj.com&cl=3
Google搜索www.ttscj.com
http://www.google.com/search?hl=zh-CN&newwindow=1&q=www.ttscj.com&lr=
3.查询此域名是否有历史记录?
http://web.archive.org/collections/web.html
4.全部符合条件,请立即注册!!!!从查询到注册,时间不要间隔太长,因为好的域名越来越少了,注册的人也越来越多,如果耽搁几分钟,这个域名就有可能就被别人注册了。
第七节、二级域名
二级域名形式如:yourname.site.com,拥有自己的独立域名是网站对搜索引擎友好的基础。目前有很多网站提供免费空间,如博客(Blog)免费空间, 企业免费空间, 免费自助建站,电子商务平台等,通常为用户分配一个二级域名,或页面存放于网站的某一路径下。
使用别人主域名的二级域名的弊端:
解释:主域名是别人的,而二级域名是你自己的。例如:www.supercss.com 是某某的,langchao.supercss.com是自己的。
1.如果你所使用二级域名的主域名受到惩罚,那么你的网站也会受到牵连;我朋友以前有个网站,做浪潮服务器的,域名langchao.supercss.com 在百度上排名很好,后来因为www.supercss.com 被百度屏蔽,导致我的浪潮服务器网站也被清除。
2.网站流量排名的时候,你所有的流量都会归功于所依托的顶级域名。
Alexa 排名默认就是顶级域名。如何规避这些风险呢?最好为自己的二级域名网站注册一个独立域名,然后做域名转发,对顾客访问和网站管理很有用。即使有一天你的二级域名的主站停止营业了,你还可以再做一个相同的网站,因为你的独立域名没有变,老用户仍然可以找到你。例如:test.supercss.cn,隐藏目的地址: test1.supercss.cn。 通常域名转发是上述方法。
第八节、使用别人主域名的二级域名的优势
1.可以借助主域名的资源,使排名快速提升。
A.举例:汽车,排名在前几位的都是大网站的汽车频道。
B.还要一阵大部分人使用BLOG进行排名,主要也是利用主站的资源。例如:我的“浪潮服务器报价”,在百度里面搜索,有两个supercss.yourblog.org ,www.mmmca.com/blog_supercss/ 都排在第一页。
2.和搜索引擎是一家人,更容易获得认可。
A.百度空间 是百度的一个产品,在百度空间里面发布内容,很容易就可以获得排名。例如:情趣内衣 结果记录中就有百度空间。
B.GoogleBlogger是google 的博客系统。通常如果你使用自己网站申请GoogleAdsense的时候,可能会被拒绝。但如果你使用Blogger来申请的话,就很容易通过了。
第九节、使用自己的主域名,发展二级域名的优势
1.网站流量排名的时候,所有的流量都会归功于所依托的顶级域名。
例如:9126.com是一个免费域名系统。查看它的 alexa流量,它自己的流量仅仅占23%,其他都是二级域名的流量。
2.搜索引擎收录时,二级域名算独立的网站,可以扩大收录页面的数量。
例如:site:alibaba.com时,收录数量达到12,100,000 项;site:china.alibaba.com 时,有3,070,000 项;site:blog.china.alibaba.com 时,有414,000项;site:wzz331190.blog.china.alibaba.com时,只有1项。
这就是说,只要不作弊,一个二级或三级域名至少能够收录一页,发展上万个二级域名,使收录的数量大量增加。
第八章链接制胜
第一节、导入链接
搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接展开分析。对网站排名致关重要的影响因素是获得尽可能多的高质量外部链接,也称导入链接。
将导入链接纳入排名重要指标的依据在于,搜索引擎认为,如果你的网站富有价值,其它网 站会提及你;对你提及越多,说明价值越大。由此引申出链接广度(LinkPopularity)在搜索引擎优化中的重要地位。当然了,既然导入链接有这么大作用,人们想方设法地为网站“制造”外部链接,导致涌出大量垃圾(spam)链接。这也就是以前优化就是在论坛发贴的原因。
一、搜索引擎目录:
全球最大的开放式目录库www.dmoz.org登录DMOZ的好处:
1.由于Google 等重要搜索引擎都采用ODP 的数据库,所以一旦被收录,你的网站的PR会很快升值。
2.国内有很多人是复制DMOZ的数据,相当于间接给你做链接,对提升PR很有帮助。
不过DMOZ是人工审核的,要求及其严格,曾经有人要花5000元,就为了让人帮他,将他的网站被DMOZ收录。例如:我朋友刘志军的网站:非常软件网,提交后一周就被收录了。收录后的PR值从0升至3。
最近百度改版,有些信息就来自于DMOZ,所以加入DMOZ好处多多。参见:DMOZ登录策略?
二、付费登录:
例如:sohu搜狐,登录需要花费300-1000。付费登录商业模式包括普通登录和固定排名,一般按年付费,网站在付费之后立即登录目录,无须等待和受到其它因素的影响。门户搜索引擎的搜索程序也比较偏重于对自身付费目录数据的抓取。总体上,付费登录对于商业网站和采用了大量不利于搜索引擎友好的手段建设的网站来说,还是有必要的。
三、高质量导入链接:
1.搜索引擎目录中的链接以及已加入目录的网站的链接。加入搜索引擎目录,说明这个链接被搜索引擎认可。
2.与你的主题相关或互补的网站。说明你的网站是专门做这方面的,比如电影网站链接电影网站。
3.PR 值不低于4 的网站PR值为4的网站很容易做到,但是PR>4的网站很难了。
百度的PR才是8。不过google对英文网站更偏向一点,大部分英文网站的PR值都大于中文的。
4.具有很少导出链接的网站。导出链接只有5个的网站比导出链接30个的网站,对你的网站的加分贡献要高。例如一个网站PR值为10,有5个外链的,每个可以分到2,比30个就高多了。
5.内容质量高的网站 ,就是原创内容多的网站。原创内容多的网站是搜索引擎最喜欢的,当然也算是高质量链接了。
四、获得高质量导入链接:
1.向搜索引擎目录提交网站。
2.在重要网站发表专业文章。围绕目标关键词在一些重要站点发表文章,在文章中或结尾带上你的网站签名。这样也是既可以获得高质量互惠链接,亦可能获得目标客户。重要网站有博客、行业内流量高,威信度高的网站。比如IT技术:zdnet,被他收录的文章会被很多人转载的,页面的PR将不会低于4的。
3.在所在行业目录提交网站。尽可能向更多的相关网络目录、行业目录、商务目录、黄页提交你的网站,加入企业库。搜索的方法:目录网站。
4..寻找网站交换链接。
五、垃圾链接:对网站排名不起作用或起反作用:
1.留言簿、评论中大量发贴夹带网站链接。例如:留言簿
2.已经加入太多导出链接的网站例如:太多导出链接。
3.博客的引用。例如:引用通告链接
4.加入链接基地,或使用程序与大量会员网站自动交换链接,被搜索引擎视为典型的垃圾链接,极有可能受到惩罚或牵连。
六、两种导入链接被误认为可以增加链接广度:
1.点击付费的搜索引擎广告链接,如百度竞价排名和Google的右侧关键词广告。例如:关键词广告中Google广告。
2.放在Flash,或者js脚本里面的链接。由于搜索引擎搜索不到,当然就无法增加链接广度了。
第二节、导出链接
导出链接就是你的网站中指向其它网站的链接。搜索引擎机器人除了分析你的导入链接,也会分析你引出去的链接,如果导出链接站点内容与你的网站主题相关联,同样有利于搜索引擎友好。这也是交换链接要选择主题相关网站的原因。还有个现象就是由于缺乏原创资料,他们常常转摘其它网站的文章作自己网站的内容,但又不注明来源,惟恐导出链接助长了竞争对手,不利于自己的网站访问量。其实,对搜索引擎来说,适量、适当的导出链接是很有必要的。
例如:今年搜索引擎市场规模高达17.24亿,这个页面是我采集艾瑞的,同时也注明了来源,也注明了作者的姓名。当然,一个页面的导出链接也不能太多,Google 认为一个页面的最大导出链接数量不应超过100个。内部链接一个站点的页面之间也往往彼此链接,如一篇文章结束后的“相关文章”列表,将该网站中同一主题下的其它文章都链接在内,不仅方便访问者,提高流量,也有利于搜索引擎索引网页,同时多个页面链接同一个内页,有助于该内页的排名提高。网站还可以通过建立多个二级域名子站,子站间彼此相链,再一起链回主站,形成一个子站群包围主站,对提高排名相当有利。
第三节、关键词链接文本及上下文语意
1.搜索引擎比较重视链接文本中出现的关键词。因此无论是导出链接、导入链接还是内部链接,都最好兼顾到链接文本中含有关键字。
图片四:新浪服务器网站导航条
2.除了链接文本,链接周围的文字既上下文的语意也非常的重要。链接分析系统通过检查连接上下文内容来确定网站与其链接对象之间的关联度,以评估该页面的内容质量。
第四节、链接的重要性
下面列出链接的重要性,在网站优化的过程中要引起重视:
1.链接所在的位置,如果链接处于网页的内容位置,则权重高,处于像页脚那样的底部位置,则权重低。
2.链接文字的离散性,就是说,如果你的网站的外链全都整齐化一地使用同一种锚文字来描述,那Google就会怀疑这是人工做出来的链接,所以可能降权。
3.链接的Title属性,Google会认为这也是相关的描述,但是这种对于用户可见性不好,相关性肯定不如直接使用锚文字的高。
4.链接超过一定的数量。可能不会被Google搜索到,Google官方举的例子是100个,超过这个数Google的蜘蛛就“审美疲劳”了。
5.链接所在的网站的IP地址与指向目标相差越大,效果越好,如果是完全一样,那你很可能是同一台服务器上的网站“近亲结婚”,Google会歧视的哦。
6.链接所在的页面如果出现与链接锚文字相同、相近的关键字,很好,会提高相关度。
7.链接所在的页面如果出现在主题相关的网站中,很好,提高相关度。
8.链接的稳定性,如果你的链接很不稳定,今天出现一万个,明天剩下几十个,那Google
就会注意到了,你很可能在发垃圾链接哦。
9.链接出现在权威网站,如:.edu和.gov这样的网站中,会提高权重。
10.互惠链接会被极大的降权。
第五节、谷歌炸弹
一、什么是谷歌炸弹
讲到最后我不得不提一下种被我们九头鸟seo团队认作网页排名的作弊行为谷歌炸弹谷歌炸弹:英文名称GoogleBomb,或被称为Google清洗(GoogleWash),Google官方译为Google轰炸。是一种试图影响特定站点在Google中查询结果排序的做法。借由Google的特定算法,一个被很多相同关键字连结到的网站将在Google=中得到一个高的页面评价。
“Google炸弹”既是动词也是名词。
这个技术是由AdamMathes在2001年4月6日一篇论文首先提出来的。论文中他使用了“Google炸弹”(原文Googlebombing)一词,并且阐述了他怎样发现Google计算页面排名的技术。他发现当Google搜索“internetrockstar”返回第一个结果的是BenBrown的页面,但是在整个站点并没有要搜索的关键字。他详细的阐述了Google的算法返回第一条结果,是由于很多BenBrown的Fans都在自己的站点引用BenBrown的站点。
二、谷歌炸弹的一些实例
关键字无能无耻连结到陈水扁总统位于总统府的总统传略网页,后续发展包括府方不断更换网页,以及透过刑事局指示搜索引擎(Google,Yahoo)移除该笔搜索结果项目,结果造成该项目在Yahoo搜索结果彻底消失,亦在Google搜索结果间断消失。目前已知府方使用Robots.txt拒绝[总统传略]被搜索,炸弹也改为指向维基百科的陈水扁条目。
"miserablefailure(可怜的失败)"一词于2005年6月1日,在Google,Yahoo和MSN排名第一的搜索结果是乔治?W?布什的简历,AskJeeves则占第二位。2005年6月2日Yooter报告乔治?W?布什是Google和Yahoo关键字“失败”和“可怜的失败”的搜索结果。2005年9月16日MarissaMayer在GoogleBlog论述了关于Google轰炸和“failure”。
三、谷歌炸弹不攻自破
Google炸弹往往在出名后消失,因为事件被网上传媒广泛报道,令炸弹本身的位置下降,故有评论指Google炸弹不足为惧。
Google炸弹应叫做“链接炸弹”才更贴切,因为手法不单对Google有影响,对其他使用链接分析的搜索引擎也有影响。
第九章怎样写标题和描述
第一节、网站标题的写作原则
一、不要超过60字节
百度标题字数3字节
谷歌标题字数:67字节
雅虎标题字数:60字节
以上是三大搜索引擎的标题字节范围,也就是说我们设置标题的时候不要超过60字节也就是30个汉字的长度,标点符号也占用字节。长了的话我们就看不到完整的标题了。
二、标题里面应该体现一直两次关键词在标题里面体现关键词是我们对搜索引擎友好的重要表现之一,这将有助于搜索引擎
在搜集和预处理我们的网页时能更快更准确的进行分类排序。
关键词的嵌入要自然,没有刻意做作的嫌疑。
三、标题要很好的体现文章内容网站标题要很好的体现这个网站要表达的内容,频道标题要很好的表现频道介绍的内
容,文章标题要很好的符合文章的中心思想。如果我们的为了增加关键词的频率而刻意的去做作关键词就会形成关键词堆积,这不会给我们的网站和网页带来什么好处,相反包括谷歌在内的搜索引擎开始了对网站周边文字内容的分析,对于关键词堆积的网站会给予相应的处罚。轻则降权,重则被封杀。
四、网站的标题要具有吸引眼球的功能网站的标题好不好直接关系到这篇文章的曝光率。因为网站或者搜索引擎展示给我们的都是网站或文章的标题加摘要的形式,没办法一下子看到你的所有内容,那么在一堆标题中怎么样才能让浏览者点击的是你的内容呢?这就需要你的标题具有吸引眼球的功能。当然如刚才我们在3中讲到的那样如果你的标题虽然很吸引人但是和你的文章标题没有什么关系的话,就成了所谓的标题党。这样不但对搜索引擎不友好,也会造成网友的反感。
第二节、标题在网站内位置的摆放规则
我们把网站结构分为首页—频道页(栏目)—内页,那么一个网站的标题对搜索引擎友好的设置情况是什么样的呢?下面表格内容将告诉我们标题要的设置要从里到外。同时要兼顾标题的长度问题。
我们经常看到有的网站一个频道的所有内容全部共一个标题在搜索引擎里面出现,更有甚者连标题都没有设置,在网上显示的直接是赤裸裸的“无标题”。这样的人的第一感觉就不好,搜索引擎也会因为收录都是同一个内容而加以省略,基本上也不用考虑有好的排名了。
第三节、怎样写描述
一.网站描述的长度
描述长度三大搜索引擎的长短顺序为、百度>雅虎>谷歌,百度在200字节左右,谷歌在150字节左右,所以网站的描述最好不要超过200个字节的长度。
二.描述的写作要力求简洁明了,文字通畅
好的描述一定要简洁明了,用100个以内的字将你的网站的主题鲜明的介绍给大家,让人一看就知道你这个网站是个什么样的网站,里面提供什么产品或什么服务。
三.描述内容最好带上核心关键词一至两次描述等原标签到目前为止还是搜索引擎了解网站的重要窗口,虽然谷歌已经降低了对网站描述的权重,但是雅虎对网站描述还是相当重视的。所以在描述的适当位置配置好关键词对网站的排名相当有利。(具体的位置)
四.描述里面带上权威信息和特色信息在描述里加入一些国际或者国内的权威认证,比如国家机关单位的下属单位、比如和某知名机构企业形成战略合作关系等……
五.“最”“免费”等字在描述里面慎用
以前我们的官方网站www.wh-seo.com 的标题和描述里面有一句话说:“九头鸟seo团队—湖北最值得信赖的seo团队”结果我们用14天时间“武汉seo培训”和“武汉seo服务”排到百度第一了,但是“武汉seo”始终在第六的位置不变,最后我们将标题和描述里面的“最”字都去掉了,我们网站武汉seo马上排百度第一。
六.一般企业网站和个人网站最好带上联系方式在描述里面带上联系方式是比较好的。互联网网络本身存在很多不确定因素,包括网站突然打不开,网速太慢网站进不去的诸多情况,这个时候我们就可以直接通过搜索引擎描述里面的联系方式和站主取得联系。
七.优秀的网站描述展示
第十章关键词
第一节关键词的收集和选择
一、通过和客户交流得到网站关键词客户做这个网站向干什么,网站的定位是什么,网站将要面对的客户群体是什么,这些都是我们的关键词选自的源头,搞清楚这些将为我们选出高质量的关键词节约时间、并提供莫大的帮助。同时客户当然会对自己网站的关键词有所了解,他也一定会给我们提供一些他自己思考的关键词,这些将都成为我们核心关键词的备选,或者他将成为我们的相关关键词或者长尾关键词。
二、查找同行业的其他网站关键词相同行业的网站设置的关键词当然可以作为我们网站关键词的备选项,在这样的地方我们一般能够找到比较满意的关键词。
查找同行业网站关键词的到时候特别要注意的一点就是,竞争对手网站的关键词。
三、使用工具找到更多的关键词
我们一般要用到的关键词查询工具有谷歌关键词谷歌Adwords关键词工具
https://adwords.google.com/select/KeywordToolExternal和另外的关键词查询小软件。另外百度的相关关键词百度风云榜都是我们优秀关键词的来源。
四、集合同事朋友的力量,创造关键词同一个东西,不同的人可能会在搜索引擎的搜索框里面输入不同的关键词来查找,比如想查找seo服务的企业来说,该企业的网站管理员会搜索“网站优化”、“seo服务”等关键词,那么该公司的老总可能会搜索“给网站排名”、“让网站流量变大”这属于专业与非专业的关键词差异。另外还有基于印象的搜索差异,比如有想找我们九头鸟seo团队来做服务的客户,如果他知道我们九头鸟seo团队,这就很好说了,直接在搜索框输入:九头鸟seo团队就可以,但是他要是不记得我们的名字了怎么办?这是他可以通过一些我们的特征来找到我们,比如湖北最值得信赖的seo团队啊,seo老九创办的那个团队啊……以上情况真实存在,所以我们在选择关键词的时候集合大众力量将是一个不错的选择,这种方法将找到更多的长尾关键词和给我们带来大量ip的关键词。
五、通过网站的流量分析系统来得到关键词其实我们网站发布内容的时候会有一些事某些特定用户很想知道的内容,所以这里面将蕴含大量我们所未知的关键词,我们可以通过流量分析系统准确的知道,我们的网站来了多少客户,他们是通过那个关键词找到我们的,这些关键词的比例怎么样。这样我们就能知道一些好的关键词了。
第二节 关键词的整理分类和与网站机构匹配
第一节中我们已经通过各种途径选择出来了大量的关键词(一般我们强掉应该先找出100-200个词组)这么多的关键词我们当然不能全部放在网站的某一个地方,我们的想办法把他分散到网站的每一个频道、每一个页面才能保证能起得更好的作用。那么我们怎么来给这么多的词进行分类呢?下面是我们常用的两种分类方式:
一、基于产品销售的分类:
产品+品牌品牌 竞争品牌词 产品长尾词产品词宽泛产品词 相关产品词 人群词
二、基于行业服务的分类:
地区+行业行业 竞争业务词业务长尾词业务词宽泛业务词相关业务词人群词我们把选出来的关键词按照上述分类方式进行归类并不算完成了工作,我们还要将这些词与我们的网站结构进行很好的匹配,将他们合理的分散到我们的整个网站中去。
三、关键词与网站建设的匹配根据网站的结构首页——频道(栏目)——内页,我们一般把所有的关键词分成三类,核心关键词——相关关键词——长尾关键词,匹配中我们要注意的一个问题是;每个页面得关键词控制在6个以内。
四、关键词的匹配流程根据我们的经验和相关的工具在一、二分类的前两类中找出我们的核心关键词,在中间三项中找出我们的相关关键词,后三项的基本上都可以作为我们的长尾关键词了。这里我们经常用到的分析工具有:
百度指数:http://index.baidu.com
谷歌关键词工具:https://adwords.google.com/select/KeywordToolExternal
关键词热度分析http://key.001pp.com
第三节 核心关键词的选择原则
核心关键词的好坏直接关系到网站优化和排名的最终价值。只有选对了关键词优化所作的一切工作才是有意义的,不然是瞎子点灯白费蜡。下面是我和我们团队所有老九们这些年来在帮客户进行关键词分析时不断总结优化出来的关键词选择步骤和模式。
选择相关关键词和长尾关键词的方法和选择核心关键词的方式差不多,都是为追求流量和客户的转换率为目标。
一:选择直达潜在客户的关键词。
这个就不用细说了,卖羊的用狗头做招牌肯定卖不好了。而且当网站关键词和网站的内容相去甚远的时候还容易遭到搜索引擎的处罚。我们做优化就是要让我们的网站有更高的客户转换率和投资回报率,如果我们都用一些很热门的关键词,这样的话即使我得到了很高的流量也没有用,因为有很多来的客户根本对我们的产品或者服务不感兴趣,这样我们就会造成很多资源的浪费。
二:选择流量太小的关键词也些关键词你自己觉得好听,很能表达你的意思,但是事实上也许这个关键词对你的网站一点意义也没有即使你花时间吧他优化到了搜索引擎第一位。还是上面我们说的那个例子,那位朋友的“培训打折网”虽然以训打折为关键词,这个词在百度谷歌的排名都是第一、相关性也很强,但是他每天的流量却很低,他告诉我们最低的时候就是他自己点的一个ip。可见一些流量小的生僻关键词是不能选为核心关键词的。
三:不要选择竞争太激烈的词关键的竞争表现在对手的付费排名和关键词广告,我们要根据自己的实际财力情况是否选择这些竞争激烈的关键词,事实上多半时间优化就能带来很好的效果。
四:选择符合自己实力的关键词有句广告词叫“只买对的,不买贵的”,我觉得这句话很符合我们关键词选择的“选择符自己实力的关键词”原则。比喻去年有个客户联系我们,说他有一个全国招生平比喻去年有个客户联系我们,说他有一个全国招生平台“培训打折网”,想让我们帮他做“培训”这个词。结果我们在第一步了解情况的时候就发现他根本没有资金去开发全国这个大市场,他原意是想先做好武汉再图其他地区只是觉得市场好但时间有刻不容缓。关键词的选择是不能完全更据自己的主管意愿来定的,考虑一下这个词你吃的了吗?
五:选择长的而不是短的关键词(5个汉字以内)相比之下,长的关键词有时候比短的关键词有优势。比如我开始的时候带领我们九头鸟seo团队做seo培训又做seo服务,那么我们在选择关键的时候面临着“武汉seo培训”和“武汉seo”和的抉择。按照百度指数当然武汉seo要高的多,那我们为什么最后选择了武汉seo培训呢?这就是搜索引擎在搜集和预处理的时候存在的分词秘密了。比如我们搜武汉seo培训的时候可能出现武汉seo但是我搜武汉seo的时候是没有武汉seo培训的。(这种理论符合大都数而不是全部)。
第四节 关键词在网页的位置分布
我们知道,搜索引擎在预处理阶段的一个基本任务就是提起源文件内容部分所含的关键词。那么在这个阶段各搜索引擎放出来的蜘蛛是怎么来抓取这些关键词的呢?或者说关键词在什么情况下有被抓取的优先权呢?
当然我们想好核心关键、相关关键词和长尾关键词应该设置在我们网站头部文件的mate=“keyword”content=“yourkeyword”红字表示部分。另外在我们的网页文章标题中也应该带上我的关键词,下面我们要将得是在一片文章当中我们的关键应该在那些地方突出出来。
我们来看一下实验图:从上图我可以看出一个网页最受关注的地区,那么这些地区就是我们布置关键词的最佳位置了。(图上按照关注度高颜色深的方式来标记的。红色地区表示关注度最高)
第五节 关键词的密度
关键词的密度就是,关键词在某个页面总的字符数和这个页面总字符数的百分比。比如“武汉seo”在www.wh-seo.com首页的密度查询结果为:
网页大小:3638字节
关键词长度:5
关键词重复次数:40
关键词总长度:200字节
关键词密度:5.50%
关键词的密度建议范围为:2%--8%。最好在4%左右。查询关键密度的工具比较多这里我们常用的有:
站长工具:http://tool.chinaz.com/
站长帮手:http://indexed.linkhelper.cn/keywordsdensity.asp
第六节 长尾理论
根据维基百科,长尾(TheLongTail)这一概念是由“连线”杂志主编Chris Anderson在2004年十月的“长尾”一文中最早提出,用来描述诸如亚马逊和Netflix之类网站的商业和经济模式。
他可以运用到社会的各个领域当中去的,网站优化在拉入长尾关键词理论之后起得了巨大的进步。我们先看看长尾关键词的模型图:
图中的红色部分我们称为红海,蓝色部分呢我们称为蓝海。红海部分表示的是少部分竞争激烈的热门关键词;蓝色部分表示的是数量众多的弱竞争力的关键词,这些词虽然每个为网站带来的流量很少,但是因为他数量巨大,所以总量可以超过红海很多倍。
尾关键词部分是网站优化的一个相当重要的部分,能不能给网站创造流量奇迹,很大程度来说是看长尾关键词运用的策略对不对。
第七节 有害关键词
最近提供安全技术McAfee(麦咖啡)已经确定了世界上最危险的搜索字词。他们搜索了大量的搜索关键字词,并深入到搜索引擎和提供流量数据的Hitwise公司。然后,他们将搜索后打开的结果进行统计,主要是检查有无针对浏览器漏洞的攻击,钓鱼网站,过度弹出等一些安全隐患。检查出来的风险结果还好,仅为1.7%。这意味着如果您的搜索结果返回250次,有4次是危险的。根据统计结果,他们排出来一些安全隐患最多的keywords。
一、最危险的类别词语:
原类别中译文最高风险类别风险(平均值)
Lyrics歌词26.3%5.1%
Free免费的21.3%7.3%
Web网页13.9%2.1%
Geargadgeteandgame齿轮,小工具和游戏12.5%2.7%
Olympus奥运会12.4%2.1%
Video视频12.3%1.7%
Celebrites名人10.7%1.4%
music娱乐圈10.7%1.7%
news新闻8.6%1.3%
miscellaneous杂项8.3%1.1%
travel旅行7.4%1.2%
foodanddrink食品和饮料7.2%0.7%
showbiz娱乐圈7.1%1.1%
election08选举6.9%0.5%
shopping购物6.8%0.7%
howdoi?我如何?6.5%1.0%
astrology占星术5.4%0.4%
sports体育5.3%0.6%
destinations目的地5.1%0.8%
health健康4.0%0.4%
economiccrisis经济危机3.5%0.5%
McAfee经过风险分析后在热门关键字加入变体数据后,然后重新统计。下面列出了危险的Wyrods变体后,那些更为不安全:
这是McAfee关于世界范围内关键词的报告,对我应该关键词的选择应该有启发,我看到的这些词是危害比较大的,但是从另外一个角度来说这些词也可能是成为我们的挑战对象。
第十一章网站设计中的seo技术元素
第一节 网站结构的扁平化
一、减少目录层次网站扁平化是网站内部结构优化的第一步。搜索引擎的蜘蛛和用户都不喜欢自己想找的东西被隐藏的很深,需要花很大的力气才能找到他,网站扁平化的具体体现是,URL的目录层次。如:
http://www.wh-seo.com/index.html一级目录
http:/=/www=.=w=h-=s=eo.c=om/se=o-Tr=/index.html二级目录
http:/=/www=.=w=h-=s=eo.c=om/sousuoyinqingyingxia=o/index.html三级目录
http://www.alibaba.com/trade/search/1i1pxyfchms/granite.html四级目录建议:大型网站(alibaba),目录结构在3-4层中型网站(行业站),目录几个应该控制在3层以内,小型网站(企业站),目录控制在2层就可以了。
二、严格控制动态网页的参数个数
http://www.yeyehuo.com/Product/Default.aspx?Type=7
http://www.yeyehuo.com/Product/List.aspx?leftmenu=1&Type=170
http://php.weather.sina.com.cn/search.php?city=麻城&c=1&dpc=1
http://php.weather.sina.com.cn/search.php?privacy=湖北& city=麻城&c=1&dpc=1
在Google已公布的资料中,Google明确指出动态参数小于3的动态网页,蜘蛛是可以顺利抓取的,达到3个参数的也没蜘蛛将有选择性的抓取,而超过3-4个参数的动态页面,Google基本不予理睬。主要原因是:
1.防止蜘蛛被死循环套牢
2.参数越多,对应的动态页就越多,可能超过蜘蛛的荷载。
3.参数多,则参数失效的几率越大另外参数多的网站存在更多的黑客攻击漏洞
第二节 内页体化
一、增加首页到内页和内页到首页的链接通路
3.首页网站地图栏目页内页
4.首页网站目录内页
5.首页TagCloud内页
6.内页内页导航栏目页首页我们看一下下面的示意图:
二、网站目录(Directory)的使用
大型站点(尤其是B2B类站点和会员制网站),往往具有较为庞大的注册用户和其他类数据信息,未了更合理的展现,我们需要各种分类,整理成目录,以确保用户和搜索引擎均能较快的找到所需信息。
企业信息常用分类方式
行业分类地区分类首字母分类
企业规模和性质分类
会员信息常用分类方式
兴趣分类地区分类首字母分类性别分类
小知识:网站目录与网站地图的区别是,网站地图以信息本身为主体,网站目录以信息的类型为索引主体。不是同一个概念。
三、增加栏目页之间的链接栏目是网站的“中间层”起承上启下的作用,并且作为一个主题鲜明的网站,其栏目必然具有较高的相关性,例如,创业网包括“创业项目”、“大学生创业”、“创业计划书”和“创业贷款”这四个栏目。大学生创业必定需要“创业项目”,有了创业项目必然考虑“创业计划书”,写好“创业计划书”就是为了“创业贷款”那么基于这样一种流程式的关系,我们除了在每一个栏目中做一个推荐外,还可以做这样一个流程图,来加强栏目间的链接,并帮助用户更快的找到最终内容。
四、内页之间增加基于业务的链接
基于业务的链接包括“相关内容”“热门内容”“推荐内容”“最新信息”“其他人在搜索”“浏览过该商品的用户浏览过”等。
五、内页之间增加基于关键词的链接
网站:创业网形式:Tag
作用:直接通过关键词链接到其他的内页,增加搜索引擎爬行的通路。
网站:网易形式:相关新闻
作用:通过对关键词进行相关性拓展,可直接连接到相当数量的相关内页,增加PV和页面相关度。
网站:搜狐形式:关键词拓展
作用:通过对关键词的拓展,原本一个内链变成了3个或者更多个内链,增加PV,和搜索效率
网站:新浪形式:关键词搜索
作用:虽没有直接的链接,但通过关键词搜索,可以比较明显的增加PV,并且较好的链接了相关页面。
六、高级内部链接的建设方法
1.RSS的使用:RSS具有相当好的聚合能力和推送能力,搜索引擎对于具有RSS功能的网站(页)给予更高的关注度,并且RSS页比首页的支柱更新频率更高,抓取率更高。
2.PDF、PPT和DOC等文档的使用:PDF等文档,均可以在其中增加链接,并且在Google的策略中,相比普通的htm和html文件,这些文档具有天生的“高贵气质”,例如,原创PDF文件自动给予PR=3.在这些文档当中,我们一般建议不要做首页的链接,而是通过关键词或者相关性,直接链接到对应的最终内页。这就相当于,一个普通的内页得到了一个PR为3的页面的链接,对提升该页面的权重有极大的好处。
3.专题页面的建设:专题页面的主要作用在于将更多的相关信息,通过主题聚合,既省去用寻找相关信息的时间,有帮助搜索引擎一次性抓取大量相关度高,信息集中的优质页面。
第三节框架结构
框架结构,即帧结构(Frame),包括IFrame,Frame。例如:框架结构示例。
<framesetrows="97,*"cols="*"frameborder="yes"border="0"framespacing="0">
<frame src="top.html" name="topFrame" frameborder="no" scrolling="No"
noresize="noresize"id="topFrame"title="topFrame"/>
<framesetrows="*" cols="164,*"framespacing="0" frameborder="no"border="0">
name="left"
<framesrc="search_left/cat20.html?&catid=20&redirect=n" frameborder="no"scrolling="yes"id="left"title="leftFrame"/>
<framesrc="CPU/cat20_list_1.html"name="main"id="main"scrolling="yes"title="main">
</frameset>
</frameset>
<noframes>在这里进行优化!
增加链接<ahref=”http://intozgc.com/CPU/cat20_list_1.html”title=”CPU报价”>CPU报价</a>
</noframes>框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。
此外,某些浏览器也不支持框架页面。如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用“Noframes”标签进行优化,把Noframe标签看做是一个普通文本内容的主页。在<Noframe></Noframe>区域中包含指向frame页的链接以及带有关键词的描述文本,同时在框架以外的区域(title,meta)也出现关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用iframe即内联框架(InnerFrame)技术来避免Frame带来的不便。所谓iframe也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动打开。iframe可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为:
实例:<iframesrc=xxwidth=xheight=xscrolling=xxframeborder=x></iframe>对搜索引擎来说,iframe中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与用户所见不同的是,搜索引擎将iframe内容看成单独的一个页面内容,与被内嵌的页面无关。
第四节 图片、FLASH优化
一、搜索引擎眼里的图片页的图片和正文比较起来被搜索引擎收录的几率大大降低了,虽然目前搜索引擎已经加大了对图片的搜索比例,但是与与网页正文的收录相比较还是有很大的差距的,下表式Google、Yahoo和百度等中英文主流搜索引擎的图片搜索占总流量的比例:
搜索引擎
百度
Ask
Sougou
Iask
均值
图片搜索比例13%10%19%16%23%16%
二、分析搜索引擎搜集图片和预处理时的储存数据
搜狗3.0给出了一个储存图片相关元数据的META_Data,他包含所用图片的相关元数据,格式如下:
<PIC>
<PIC_URL>
图片在互联网中的URL地址
</PIC_URL>
<PAGE_URL>
图片所在网页的URL地址
</PAGE_URL>
<ALT_TEXT>
图片的替换文字
</ALT_TEXT>
<ANCHOR_TEXT>
<SUR_TEXT>
以图片为目标的超链接的显示文本
</ANCHOR_TEXT>
</SUR_TEXT>
页面中提起图片周围的文本
<PAGE_TITIL>
<WIDTH>
图片在页面中的标题
</WIDTH>
</PAGE_TITIL>
图片的宽度
<HEIGHT>
图片的高度
</HEIGHT>
</PIC>
结论:图片介绍网页的url、图片的替换文字、图片周围的文本介绍和图片在页面中的标题是我们可控的而却对我们网站关键词的曝光时有益的,我们对图片做优化时必须注重这四大优化元素。
三、结合实例分析图片优化的四大要点
基于我们在二中得出的结论,我们可以针对图片搜索的搜索引擎做出一下四个方面的优化工作
1.补充完善图片的ALT信息,在描述中最好带上我们的目标关键词;
2.图片周围应该有丰富的描述信息,描述的内容应该围绕我们的关键词开展;
3.图片所在的页面标题和URL应该包含图片信息中提炼的关键词;
4.不仅网页需要外部链接,图片也需要外部链接,而且链接锚文本最好含有关键词。
第五节 代码减肥
代码设置的不妥不仅影响网页的加载时间,还严重影响蜘蛛程序对网页内容的抓取。通过对为网页代码进行消减去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到重要内容,整个网页最好不要超过105k,Google只对内容的前5000个字进行索引。网页减肥设计一下几个要点:
一、css样式
佛山网页制作最好通过CSS(层叠样式表)来统一定制网站风格。将所用的CSS样式全部放在一个或者几个.css文件里面,然后在网页中进行调用。
二、JavaScript:
简化js中的函数名称和变量,例如在谷歌里面,函数名称只用1个或者2个字符;另外将网页的公告部分转换为脚本并保存于js文件里。这样可以减少文件大小,加快下载速速,同时也方便管理。不过不能将导航等优化的关键代码转换成js,否则搜索引擎搜索不到。注意:有很多网站站长将对方的友情链接置于js中,是一件很不友好的事情。
三、慎用网页减肥工具
通常的网页减肥工具,对htm减肥具有一定的破坏性,常常为了减肥将一对标签的后半部分删除了,造成网页的不完整。如:
处理前:<table><tr><td>第一行</td></tr><tr><td>第二行</td></tr></table>
处理后:<table><tr><td>第一行<tr><td>第二行</table>处理后</td></tr>被去掉了,使页面不完整。
四、删除空格和回车如果要更加苛刻的减肥,那最后一步就是删除空格了,还可以使文件大小下降很多。
不过删除空格后的页面由于没有阶梯排列,将很难读懂。例子:百度首页的代码就非常紧凑。
第六节 Robert.tet设置
搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。robots.txt文件应该放在网站根目录下。
一、robots.txt文件的格式
"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL,orNL作为结束符),每一条记录的格式如下所示:
"<field>:<optionalspace><value><optionalspace>"。在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下:User-agent:该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。
Disallow:
该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以 Disallow开头的 URL均不会被 robot访问到。例如"Disallow:/help"对/help.html和/help/index.html都不允许搜索引擎访问,而"Disallow:/help/"则允许robot访问/help.html,而不能访/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。
二、robots.txt文件用法举例
三、Robot特殊参数:(Google)
1.允许Googlebot:
如果您要拦截除Googlebot以外的所有漫游器访问您的网页,可以使用下列语法:User-agent:Disallow:/
User-agent:Googlebot
Disallow:
Googlebot跟随指向它自己的行,而不是指向所有漫游器的行。
2."Allow"扩展名:
Googlebot可识别称为"Allow"的robots.txt标准扩展名。其他搜索引擎的漫游器可能无法识别此扩展名,因此请使用您感兴趣的其他搜索引擎进行查找。"Allow"行的作用原理完全与"Disallow"行一样。只需列出您要允许的目录或页面即可。
您也可以同时使用"Disallow"和"Allow"。例如,要拦截子目录中某个页面之外的其他所有页面,可以使用下列条目:
User-Agent:GooglebotDisallow:/folder1/Allow:/folder1/myfile.html这些条目将拦截folder1目录内除myfile.html 之外的所有页面。
如果您要拦截Googlebot并允许Google的另一个漫游器(如Googlebot-Mobile),可使用"Allow"规则允许该漫游器的访问。例如:
User-agent:Googlebot
Disallow:/
User-agent:Googlebot-Mobile
Allow:
使用*号匹配字符序列:
您可使用星号(*)来匹配字符序列。例如,要拦截对所有以private开头的子目录的访问,可使用下列条目:
User-Agent:Googlebot
Disallow:/private*/
要拦截对所有包含问号(?)的网址的访问,可使用下列条目:
User-agent:*Disallow:/*?*
使用$匹配网址的结束字符
您可使用$字符指定与网址的结束字符进行匹配。例如,要拦截以.asp结尾的网址,可使用下列条目:
User-Agent:Googlebot
Disallow:/*.asp$
您可将此模式匹配与Allow 指令配合使用。例如,如果?表示一个会话ID,您可排除所有包含该ID 的网址,确保Googlebot 不会抓取重复的网页。但是,以?结尾的网址可能是您要包含的网页版本。在此情况下,可对robots.txt 文件进行如下设置:
User-agent:*Allow:/*?$Disallow:/*?
Disallow:/*?一行将拦截包含? 的网址(具体而言,它将拦截所有以您的域名开头、后接任意字符串,然后是问号(?),而后又是任意字符串的网址)。
Allow:/*?$一行将允许包含任何以?结尾的网址(具体而言,它将允许包含所有以您的域名开头、后接任意字符串,然后是问号(?),问号之后没有任何字符的网址)。
第七节 301永久性重定向和404错误页面
一、404访问的页面暂时不存在当网站进行调整、页面进行修改的时候,便会有网页被删除、改名或移动位置,这时候,虽然相应内容的网页还存在于网站中,但使用原来的地址访问则无法访问,或者由于拼写错误导致一个无效的链接,都将使服务器返回404 状态码。
但是,Web服务器默认的404错误页面,均十分简陋、呆板且对用户不友好,无法给予用户寻找相应信息的更多线索,用户看到这类页面往往最直接的反应并是关闭浏览器窗口离开,这在很大程度上给网站造成损失。毕竟,对网站来说,用户永远是最重要的资源,以这种方式损失用户更意味着某种程度的失败。
这也是许多网站使用自定义404错误页面的原因。通过良好的自定义404页面,可以包含对网站的相应介绍、用户可能感兴趣的内容链接或者网站内容导航链接、内容搜索功能等,能够有效地帮助访问者找到其欲寻找的内容或相似的内容,提高用户在网站内浏览更多信息的机会。
二、正确定义404错误页面
1.对于已经存在的信息由于路径改变而导致访问不了时,应该在IIS中定义404错误指向一个动态页面,在页面里面使用301跳转到新的地址,此时服务器返回301状态码。
2.当访问一个错误的链接时,将调用404页面,但由于在IIS里面设置的不同将导致返回不同的状态码:
404指向的是一个htm文件,此时页面返回的404状态码,这是正确的。
404指向的是一个URL,例如/error.asp,如果不在页面里面进行设置,仅仅是返回提示的HTML代码,将导致页面返回200状态码,此时的危害在于,当很多页面找不到时,都返回和访问正常页面时返回一样的200状态码,将使搜索引擎认为该链接存在,并以错误页面的内容进行收录,当这样的链接很多时,将导致大量页面重复,使网站排名降低。处理方法:在显示完提示内容后,增加语句:Response.Status="404NotFound",这样就保证页面返回404状态码。
3.避免在调用404页面的时候返回302状态码,容易被搜索引擎认为是重定向作弊。
4.检测方法,使用HttpWatch 查看返回代码。参见:
在这个例子中,我请求的是http://www.sina.com.cn/1223.html ,新浪返回错误页面,然后5秒钟后,使用js跳转到新浪导航页。
第八节 网站地图sitemap
网站地图文件原本是为了方便访问用户更好的了解站点的架构而设置的,他能帮助用户便捷的查阅到所需信息。网站地图有两种表现形式:WEB界面形式和XML文本形式:
一、WEB界面形式它作为构成网站的诸多网页之一,以纯文本超级链接形式为最佳表现形式,用户和搜索引擎机器人都可以识别。传统网站用来方便用户,现在更主要是帮助搜索引擎找到深层次的页面。大型网站可使用Xenu等工具来制作。
二、XML文形式
不易于绝大多数用户理解阅读,专门为搜索引擎机器人而准备。可在Roberts.txt文件中进行描述。目前,包括google在内的三大搜索引擎均支持sitemap协议。
三、两种地图的截图(更多相关知识到www.sitemap.org查看。)
第十二章内容为王
第一节 搜索引擎对网站内容的要求
一、创造属于你自己的独特内容百度喜欢独特的原创内容,所以,如果你的站点内容只是从各处复制而成的,很可能不会被百度收录。
——百度对网站内容的说明二、向访问者提供他们要查找的信息在网页上提供高品质的内容,尤其是主页,这是你要做的最重要的工作,如果你的网页包含有用信息,其内容就可以吸引许多访问者并使其他网站管理员乐于链接到你的网站,要创建实用且信息丰富的网站,网页文字应清晰、准确地表述要传递的主题,想一想,用户会使用那些关键词来查找你的网页,然后尽量在网站上使用这些关键词。
——Google对网站内容的说明
第二节 如何丰富我们的网站内容
得我有一篇文章叫“链接制胜,内容为王”,简单的分析了内容为王不仅是网站运营人员的金科玉律,他对seo人员是否获得显著优化效果也具有十分重要的意义。任何一个网站都需要内容来作为支撑点的。不过作为seo我们研究的是怎么样的文章能更加具有吸引力,吸引蜘蛛的频繁光临,吸引浏览客户的眼球。本节我们将就这个问题进行探讨。
一、网站内容的四大来源
1.原创和伪原创文章 原创文章的好处不言而喻,原创文章更加受到蜘蛛的青睐,在自己文章里带上链接欢迎别人转载,将给你带来更多的外链。原创能让更多的人准确的了解和认识你。不过原创也有他的不足,那就是很耗时间和精力。伪原创内容处于原创文章和直接复制别人内容直接,这是一般网站快速丰富内容的首选。
2.复制别人的内容当我们在网上看到不错的文章,对他进行转载是比较好的文章来源,但是我们知道搜索引擎在对所有网友搜集之后是要对重复内容消重的,也就要要过滤那些重复内容,一般情况下不要转载那些被大范围转载的内容。
另外原创文章的站点只有在不断更新自己原创文章的同时提升自己的网站权重,只用这样才能将自己原创文章被转载的负面影响降到最低。
3.翻译国外的原创文章我们还可以翻译国外的一些比较有影响力的文章,比如我们网站http://www.wh-seo.com里面的一篇文章:网络营销为什么可以两个小时赚别人一年的钱?就是翻译的部分国外网站的内容。这篇文章为我带来了不少的外链和流量。
4.会员共享内容很多的网站带上了BBS、Ask问答等板块或者具有同等功能,那么他们很多程度上可以依靠会员的力量来不断更新文章。这是一个很不错的方式。
二、内容采集有哪些弊端目前网上流传着很多的自动采集文章的程序,我们也叫他小偷程序。通过小偷程序,一般站长就可以让这个复制机器来免费为自己工作,不断往自己的数据库里面添加内容。虽然这样减免了我们站长的许多事情,但是这样做存在不少的弊端。
1.产生大量的相似性页面
2.如果采集系统设置的采集量和自动发布量不加以控制,在短期内创建大批量的页面,很有可能被谷歌丢进sandbox里面去了。
3.这种采集和我们的复制黏贴别人的文章没有什么两样,他会导致搜索引擎对原网页权重的定向判断,你再不断给这个网站增加权重。
4.采集的设置都是有限的,很多的采集程序都不是很完美的,他们会丢失数据,造成文章不完整,让用户的阅读体验打折扣.
三建立问答板块的重要性建立有效的问答模块,可以让更多的人吧对基于网站所在行业的问题在这里进行提问,然后又跟给出专卖的答案,我觉得这种方式十分的不错,因为他既使得网站原创更新频繁同时他在不断创建互联网上其他众多人群想高清楚的答案。这样他不仅对搜索引擎特别友好,同时也具有很好的用户体验基础。
第十三章网站优化中的作弊行为
一:桥页跳页
桥页跳页纯粹是为某个关键词搜索排名而设计的网页,一般不在网站的导航里出现。最早使用在色情网站中。
二:关键词叠加
关键词叠加是网页中过分重复使用关键词,最基本的就是在网页中访客看不到的地方添加。如:标题标签、描述标签、图片的替代文字中,等等。比如:
"网络营销策略网络营销策略网络营销策略网络营销策略网络营销策略网络营销
策略网络营销策略网络营销策略网络营销策略网络营销网络营销网络营销网络营销网络营销网络营销网络营销网络营销网络营销网络营销网络营销网络营销网络营销网络营销"
三:关键词堆积
关键词堆积和关键词叠加常常指的是同一种情况,有些人将其分开,关键词叠加指写一些垃圾句子,关键词堆积指这些垃圾句子放在图片上。比如使用Alt标签。有些人在网页中插入透明图片。然后只要你将鼠标方在图片上,就会显示那些垃圾句子。
四:隐藏文字和透明文字
隐藏文字是很多人比较喜欢的作弊方式。这些文字只让搜索引擎看见,而不让访客看见。透明文字就是将文字的颜色设置成与页面背景颜色一样的颜色。使访客不易看到。其实这种方法并不巧妙。使用Alt+A就能清楚的看到文字。
五:细微文字
这些文字一般都很小,放在页面的最上或最下面。这些颜色虽然不是和像隐藏字那样和背景颜色一样,但也经常颜色接近。
六:障眼法
障眼法是一种伪装网页的方式,就是用一种代码,判断来访者是搜索引擎还是一般游览者,这是一个典型的欺骗搜索引擎的障眼法。搜索引擎看到的是一个非常严格的一片内容,而一般浏览者看到的是另外的一个内容。与搜索引擎看到的截然不同。
第十四章SEO常用术语
搜索引擎优化(SEO) 搜索引擎营销(SEM)关键词(keyword) 权重(Weightinsee)排名(Ranking)垃圾技术(spamming)竞价排名(Paidlisting)反作弊(Anti-Spam)自然排名(Organiclisting)桥页(Cloaking)PR值(PageRank)黑帽seo(BlackhatSEO)相似网页(SimilarPages)白帽seo(WhitehatSEO)补充材料(SupplementalResult)搜索蜘蛛(Spider)外部链接(ExternalLinking)网站地图(sitemaps)内部链接(InternalLinking)链接工厂(Linkfarm)外页优化(OffpageOptimization)MFA(madeforAdsense)内页优化(OnpageOptimization)目录(directory)收录(Embody)投资回报率ROI(ReturnOnInvestment)信任级(TrustRank)搜索引擎结果页面(SearchEngineRseultspage)沙盒效应(sandbox)W3C(TheWorldWideWebConsortium)
第十五章如何制作完美的网站优化分析报告
一、了解网站背景情况
二、选择好网站的定位
三、按照139条对网站进行针对性分析分析每一项的优劣
四、针对网站的不足和网站的市场地位给出修改意见
五、成本预算
评论列表: