百度搜索代码,百度在美国的代码是多少啊?

2022-02-05 00:42:33 百科大全 投稿:一盘搜百科
摘要百度 2005年8月5日 招股说明书显示百度搜索代码,2003年百度净亏损人民币8883万元,而在2004年已经扭亏为盈,并且有人民币1.2亿元的盈余。在2002年到2004年期间,百度主营业务收入的

百度 2005年8月5日 招股说明书显示百度搜索代码,2003年百度净亏损人民币8883万元,而在2004年已经扭亏为盈,并且有人民币1.2亿元的盈余。在2002年到2004年期间,百度主营业务收入的年均增长幅度达到了惊人的225%.

百度搜索代码,百度在美国的代码是多少啊?插图

发行商: 百度公司

股票代码:BIDU

募股类型: 证券交易委员会注册首次公开募股

所募有价证券: 美国存托股票(ADS)

首次公布募股价格范围:19美元至21美元

调整后募股价格范围:23美元至25美元

最终定价范围:27美元

首次发行股票数量: 3,699,935股美国存托股票, 初步中点总价为7400万美元

调整后股票发行数量:4,040,402股美国存托股票,调整后中点总价为9700万美元

最终发行股票数量:4,040,402股美国存托股票,总价为1.09亿美元

初次绿鞋:高达512,752股美国存托股票

调整后绿鞋:高达563,822股美国存托股票

交易所/代码:纳斯达克/BIDU

CEO:李彦宏(持股比例:IPO前:25.8%;IPO后:22.9%)

IPO后持股结构:管理层(李彦宏22.9%、CTO刘建国0.9%、CFO王湛生1%、COO朱洪波1%、副总裁梁冬0.4%);

主要股东:(德丰杰25.8%、徐勇7%、Integrity9.7%、Peninsula8.5%、GoogleIPO前2.6%)股东(IDG 4.2%)

公司注册地:开曼群岛

员工人数:750

主要业务:搜索引擎

财年截止日:12月31日

网址:w

承销商:高盛、瑞士信贷第一波士顿等证券交易委员会注册首次公开募股

请百度的是如何进行数据搜索的?

真正意义上的搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。

现在的搜索引擎已普遍使用超链分析技术,除了分析索引网页本身的内容,还分析索引所有指向该网页的链接的URL、AnchorText、甚至链接周围的文字。所以,有时候,即使某个网页A中并没有某个词比如“恶魔撒旦”,但如果有别的网页B用链接“恶魔撒旦”指向这个网页A,那么用户搜索“恶魔撒旦”时也能找到网页A。而且,如果有越多网页(C、D、E、F……)用名为“恶魔撒旦”的链接指向这个网页A,或者给出这个链接的源网页(B、C、D、E、F……)越优秀,那么网页A在用户搜索“恶魔撒旦”时也会被认为更相关,排序也会越靠前。

搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。

从互联网上抓取网页

利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。

建立索引数据库

由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

在索引数据库中搜索排序

当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。

最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

搜索引擎的Spider一般要定期重新访问所有网页(各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率),更新网页索引数据库,以反映出网页内容的更新情况,增加新的网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样,网页的具体内容和变化情况就会反映到用户查询的结果中。

互联网虽然只有一个,但各搜索引擎的能力和偏好不同,所以抓取的网页各不相同,排序算法也各不相同。大型搜索引擎的数据库储存了互联网上几亿至几十亿的网页索引,数据量达到几千G甚至几万G。但即使最大的搜索引擎建立超过二十亿网页的索引数据库,也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的内容。而互联网上有更大量的内容,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。

你心里应该有这个概念:搜索引擎只能搜到它网页索引数据库里储存的内容。

声明:一盘搜百科所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系 88888@qq.com