L’infrastructure utilisée par le géant de la recherche Google est un mystère que beaucoup aimeraient percer, que ce soit les concurrents ou les utilisateurs étonnés de la réactivité sans faille des services malgré un nombre d’utilisateurs record.

google-pingdom-tools

Voici quelques réponses et hypothèses concernant les Data centers de Google.

La culture du secret

Google estime que leurs Data Centers leur donnent un avantage important face à la concurrence, c’est pourquoi peu d’informations filtrent sur le nombre de centres, leur taille, leur localisation, leur puissance ou encore la consommation électrique de ceux-ci.

Pour rester discrets, les data centers ne sont d’ailleurs pas créés sous le nom de Google, mais par des sociétés LLCs (Limited Liability Corporations) soit l’équivalent de nos sociétés à responsabilité limité en France.

Où sont les Data Centers ?

Si on compte les sites en construction, les connaissances actuelles font état de 19 sites aux Etats-Unis, de 12 en Europe, 3 en Asie, 1 en Russie et 1 en Amérique du Sud. Tous les data centers ne sont pas la propriété de Google, qui continue à louer de l’espace dans des centres tiers (principalement pour du Peering).

datacenters-google-dans-le-monde
datacenters-google-en-europe

Les plus de 500 adresses IP utilisées par le moteur de recherche Google donnent d’ailleurs peu d’informations quant à la localisation des centres puisque la plupart pointent vers le quartier général de Google à Mountain View en Californie.

Voir la carte des Data Centers ici.

Le gigantisme

D’après les rapports de comptes de Google, la firme aurait dépensée 1.9 milliards de dollars en 2006 pour ses centres et 2.4 milliards de dollars en 2007. Chaque nouveau projet de data center coûterait 600 millions de dollars.
De quoi payer la consommation électrique de chaque centre qui serait de 50 MegaWatts pour les centres majeurs et pourraient atteindre la valeur estimée de 103 MegaWatts.

Dans l’Oregon, le site de Google serait composé de 3 Data Centers de 6380m², un bâtiment administratif de plus de 1800m², d’un dortoir de 1500m² pour les employés de passage et 1600m² pour les tours de refroidissement.

google-south-carolina

Le choix des sites

Le choix de l’emplacement des Data Centers est déterminé par plusieurs critères :

  • La disponibilité d’une source d’énergie bon marché à proximité,
  • La présence de sources d’énergie renouvelable : éoliennes, énergie hydro-électrique,
  • La proximité de larges sources d’eau pour les besoins de refroidissement (rivières ou lacs),
  • La présence de larges espaces pour facilité la sécurité et la confidentialité du site,
  • La répartition des Data Centers : afin de maintenir une communication efficace entre les sites, les observateurs pensent que la proximité et la bonne répartition des centres est un élément important pour des temps de réponse faibles,
  • Les réductions d’impôts : beaucoup de régions ou d’Etats fournissent des avantages à Google en échange de son installation.

L’architecture matérielle et logicielle

Google utilise des machines à bas prix montées en cluster et y ajoute des alimentations à très bon rendement. Ces alimentations sont modifiées pour y intégrer des batteries, leur permettant de fonctionner en « Alimentations sans Interruption » (UPS) plus communément appelées onduleurs.

Google fabriquerait aussi ses propres switchs 10 Gigabit à faible consommation. En 2006, le nombre de serveurs estimé était de 450 000.

Pour la partie logicielle, Google utilise des logiciels maison pour tirer pleinement partie de son architecture répartie :

  • Google File System (GFS) : c’est un système de fichier distribué fiable et extensible pour les applications ayant un recours intensif aux données. Le système est basé sur Linux et ext3. Il est optimisé pour les fichiers de grande taille et conçu pour continuer à fonctionner en cas de panne de certains éléments du cluster (résilience). Voir aussi l’article de Wikipedia.
  • Google Web Server (GWS) et Google Front End (GFE) sont des versions personnalisées d’Apache utilisées pour héberger les sites Web de la firme. Google GFE/1.3 est par exemple utilisé pour héberger Gmail ou Blogger. GWS est utilisé entre autres pour Google Images (Version 2.1). Voici une liste non exhaustive des services de Google et de la technologie serveur correspondante :

    Main Search: GWS/2.1
    Google Accounts: GFE/1.3*
    Google AdSense: GFE/1.3*
    Google AdWords: GFE/1.3*
    Google Analytics (Login Page): GWS/2.1
    Google Analytics (Auth Page): GFE/1.3*
    Google Analytics (Other Pages): ucfe*
    Google Analytics (Analysis Image and JS): ucfe
    Google Analytics (Images/JS/CSS/Flash): ga-reporting-fe
    Google Answers: GFE/1.3
    Google Base: asfe
    Blogger: Apache
    Google Book Search: OFE/0.1
    Google Calendar: GFE/1.3
    Google Catalogs: OFE/0.1
    Google Code: codesite/2104877
    Google Desktop: GFE/1.3
    Google Directory: GWS/2.1
    Google Downloads: GWS/2.1
    Google Finance: SFE/0.8
    Google Finance Stock Charts (Images): FTS (C)1997-2006 IS.Teledata AG
    Froogle: cffe
    Google Groups: GWS-GRFE/0.50
    Hello: Apache/2.0.53
    Google Help Pages: TrakhelpServer/1.0a
    Google Images: GWS/2.1
    Google Labs: Apache
    Google Local / Maps: mfe
    Google Local/Maps (Images): tfe
    Google Mail: GWS/2.1
    Google Mobile: GWS/2.1
    Google Moon: mfe
    Google Moon (Images): GWS/2.1
    Google Music Search: mws
    Google News: NFE/1.0
    Orkut: GFE/1.3*
    Google Pack: COMINST/1.0
    Picasa (.com): Apache/2.0.53
    Picasa (.google.com): GWS/2.1
    Google Page Creator (Sign-up page): GFE/1.3*
    Google Page Creator (User pages): GFE/1.3
    Google Personalized Homepage: igfe
    Google Scholar: GWS/2.1
    Google Search History: Search-History HTTP Server
    Google Sets: Apache
    Google Site-Flavored: GWS/2.1
    Google Sitemaps: GFE/1.3
    Google SMS: GWS/2.1
    Google SMS Search Requests: SMPP server 1.0
    Google SMS (GMail Registration): GFE/1.3*
    Google SMS (Page Viewer): GFE/1.3
    Google Suggest: Auto-Completion Server
    Google Transit: mfe
    Google Translate: TWS/0.9
    Google Video: GFE/1.3
    Google Reader: GFE/1.3
    Google Ride Finder: Apache
    Google Talk: GWS/2.1
    Google Toolbar: GFE/1.3
    Google Toolbar (PR Lookup): GWS/2.1
    Google Web Accelerator: GFE/1.3
    Google Web Alerts: PSFE/4.0

  • MapReduce: c’est un framework utilisé pour analyser et générer de grands volumes de données. Les programmes développés sur l’architecture MapReduce sont automatiquement parallélisées sur un ensemble des machines « standards » du cluster de Google. MapReduce traite couramment plusieurs TéraOctets de données sur plusieurs milliers de machines. Un exemple de traitement est de compter le nombre d’occurence d’un mot dans plusieurs documents : les occurences seront calculées pour chaque document sur des machines différentes et sommées à la fin.
    Au départ pensé pour être utilisé dans des cas spécifiques, le framework s’est révélé applicable dans beaucoup de traitements de données différents utilisés dans les applications Google.
    Pour plus d’informations, consultez ce document PDF.
  • BigTable : c’est un système de stockage distribué de données structurées prévu pour être extensible à des volumes de données dépassant le PetaOctet. Il est utilisé par le moteur de recherche de Google, par Google Earth ou encore Google Finance.
    Pour plus d’informations, consultez ce document PDF.

La Disponibilité

Cette infrastructure distribuée et résiliente permet aux services de Google d’afficher une disponibilité supérieure à 99,99% comme le confirme ce rapport de Pingdom qui s’intéresse aux différences de disponibilité du moteur de recherche entre les pays.

royal-pingdom-google-availability-differs-greatly-between-countries

La culture d’entreprise

La culture d’entreprise de Google est d’après moi un élément déterminant de sa réussite. On est très loin de la culture d’entreprise française.

google-zurich

Voici le reportage « Google, la machine à penser« , riche en informations sur cet esprit d’entreprise :

En quelques secondes, avec une exactitude stupéfiante, Google apporte aux internautes la réponse à la requête qu’ils ont lancée sur Internet. Le moteur de recherche, né il y a dix ans en Californie, a révolutionné notre vie quotidienne. Retour sur un phénomène de société.

En moins de dix ans, Google s’est transformé. La petite société créée en 1998 par deux copains de fac passionnés d’informatique est devenue en peu de temps un véritable empire qui compte aujourd’hui près de 14 000 employés.

Le moteur de recherche imaginé par Sergey Brin et Larry Page sur le campus de l’université de Stanford, en Californie, est devenu un outil utilisé quotidiennement par un demi-milliard de personnes à travers le monde.

Avec une simple idée – donner aux internautes la possibilité d’accéder gratuitement et en un seul clic aux informations qu’ils cherchent -, ils sont parvenus, au fil du temps, à générer quelque 10 milliards de dollars de chiffre d’affaires.

Mais qui se cache derrière Google ? Comment fonctionne cette entreprise ? Comment est-elle organisée ? N’est-elle pas trop puissante ? Peut-on utiliser ses services en toute confiance ? Autant de questions auxquelles Gilles Cayatte répond dans ce documentaire inédit.

Entre performance et prédation

En filmant l’envers du décor, il fait pénétrer le téléspectateur dans les coulisses de cet univers à part composé d’un googleplex (un siège social) et de googlers (des salariés) épris de googlitude.

Il révèle une organisation régie par une hiérarchie réduite au minimum, où les employés – à peine trentenaires – semblent tous être mus par un même désir : innover en permanence pour que leur entreprise soit toujours plus créative et performante.

Il montre aussi comment une ambition, au départ généreuse – la mise à disposition gratuite de tous les savoirs -, devient peu à peu une machine destructrice. « Google, explique Michael Malone, éditorialiste au Wall Street Journal, ressemble à un énorme prédateur. » Ceux qui se trouvent sur son passage n’ont que peu de chance de résister à sa puissance…

Quelques photos

D’autres ici ou ici.

Et si vous voulez voir où tout à commencé, vous pouvez lire ce rapport de Sergey Brin et Lawrence Page pour Stanford : The Anatomy of a Large-Scale Hypertextual
Web Search Engine
à l’origine du projet Google.

Pour chercher du travail chez Google, c’est par ici ou par là ;)

Références :

Google Platform, Wikipedia.
Map of all Google data center locations, PingDom.
Google availability differs greatly between countries, PingDom.
Google DataCenter FAQ, Data Center Knowledge.
Google Architecture, High Scalability.
Papers Written by Googlers, Google Research.

 

  • Classé sous : Web

 

36 réponses pour "Google : un mystère fascinant et bien gardé"

  1. tdad  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.12 avec Windows Windows XP
    21 avril 2008 @ 10:08
    1

    Excellent recueil d’informations sur Google, souvent méconnu du public, même internaute. je pense que ça va attirer beaucoup de trafic sur ton site, j’espère que t’as prévu un bon serveur ;)

  2. erdnaxeli  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.14 avec Windows Windows XP
    21 avril 2008 @ 11:01
    2

    Pas mal le documentaire.
    C’est plus une boite, c’est carrément un écosystème. Ça parait très sympa et en même temps ça fait peur, google est partout et bouffe tout le monde.
    Brrr !

  3. Etan  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.14 avec Windows Windows XP
    21 avril 2008 @ 12:22
    3

    Très instructif, merci ! C’est dans ces moments là que l’on s’aperçoit de la puissance de Google.

    :thumbsup:

  4. Les arcanes de Google : une architecture, des serveurs et une culture  Surfe sur WordPress WordPress 2.5
    21 avril 2008 @ 13:47
    4

    […] Google : un mystère fascinant et bien gardé […]

  5. Sébastien C.  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.14 avec Windows Windows XP
    21 avril 2008 @ 14:45
    5

    Je ne préfère pas demander … quoi que si, combien de temps as tu mis pour collecter toutes ces informations ? Faut être malade :no:

    En tout cas merci beaucoup, article très très intéressant. :yes:

  6. En vrac #35  Surfe sur WordPress WordPress 2.5
    21 avril 2008 @ 16:30
    6

    […] Google : un mystère fascinant et bien gardé, […]

  7. Tizel  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.14 avec Windows Windows XP
    21 avril 2008 @ 18:31
    7

    Bravo et surtout Merci pour ce reportage très bien documenté ;)
    Je ne doute pas que tu nous donneras de plus amples informations si tu arrives à percer le secret de ce monstre ;)

    Tizel

  8. Les arcanes de Google « actublog  Surfe sur WordPress WordPress MU
    21 avril 2008 @ 18:33
    8

    […] Google : un mystère fascinant et bien gardé […]

  9. www.tomateo.com  Surfe surUnknown browser
    21 avril 2008 @ 22:04
    9

    Google : un mystère fascinant et bien gardé…

    L’infrastructure utilisée par le géant de la recherche Google est un mystère que beaucoup aimeraient percer, que ce soit les concurrents ou les utilisateurs étonnés de la réactivité sans faille des services malgré un nombre d’utilisateurs r…

  10. Aurélien  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.14 avec Windows Windows XP
    22 avril 2008 @ 15:53
    10

    Merci pour cet article !

    Etant donné la taille et les ressources nécessaires à l’installation d’un DC, voir un site à Paris est un peu surprenant.

  11. Papy  Surfe sur Mozilla Firefox Mozilla Firefox 3.0b5 avec Windows Windows XP
    22 avril 2008 @ 16:37
    11

    @Aurélien : pour Paris c’est difficile à dire, il n’y a pas de gros DataCenter mais sûrement de la location d’espace.

    Par contre pour quels services ? Aucune idée. Visiblement google.fr n’attaque pas un datacenter en particulier mais va plutôt vers un datacenter quelconque (le moins chargé sûrement).

    Only Google knows.

  12. pickupjojo  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.14 avec Windows Windows XP
    22 avril 2008 @ 18:40
    12

    Superbe article, bravo Papy, c’était très intéressant ! :thumbsup:

  13. spawnrider  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.14 avec Windows Windows XP
    22 avril 2008 @ 22:33
    13

    Très bel article :thumbsup:

  14. Net en Vrac - n°23 | La Geek Attitude  Surfe sur WordPress WordPress 2.5
    22 avril 2008 @ 22:48
    14

    […] Google : un mystère fascinant et bien gardé […]

  15. sbruck  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.14 avec Windows Windows XP
    22 avril 2008 @ 23:02
    15

    j’y ajouterai la fonctionnalité de blacklist utilisé par firefox2 automatiquement, et maintenu par google..
    et oui, régulièrement, plusieurs fois par jour votre firefox se connecte automatiquement chez google (et donc vous indirectement), pour récupérer sa blacklist de vilain site… mais au final, on se demande qui sont les méchants, qui sont les gentils ;)
    http://www.oiepoie.nl/2007/11/25/sniffing-googles-blacklist-for-firefox/

  16. erdnaxeli  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.11 avec Linux Linux
    22 avril 2008 @ 23:12
    16

    @sbruck : pas forcément. Cette option est désactivable dans les paramètre. La liste noir es alors chargé depuis mozlla et non google.

  17. links for 2008-04-23 at DeStructUred Blog  Surfe sur WordPress WordPress 2.2
    23 avril 2008 @ 4:30
    17

    […] http://www.papygeek.com/web/google-un-mystere-fascinant-et-bien-garde/ (tags: google Blog) […]

  18. le blog à Ollie » Liens du jour  Surfe sur WordPress WordPress 1.5
    23 avril 2008 @ 23:28
    18

    […] L’infrastructure utilisée par le géant de la recherche Google. […]

  19. Nicknick63  Surfe sur Mozilla Firefox Mozilla Firefox 1.5.0 avec Windows Windows XP
    24 avril 2008 @ 14:47
    19

    Article très intéressant. Ca fait longtemps que j’ai peur de Google, leur politique est vraiment horrible et ils commencent à prendre beaucoup trop de pouvoir !

    Mais Google, contrairement à ce que beaucoup pensent, n’est pas seul, il y a plein de petits moteurs innovant quiq propose un service d’une immense qualité.
    Pour moi le meilleur de tous est Exalead, je fait la plupart de mes recherches avec.
    http://www.exalead.fr/

  20. nifyno  Surfe sur Internet Explorer Internet Explorer 7.0 avec Windows Windows XP
    24 avril 2008 @ 15:10
    20

    bravo, ce que je pense et ce que je crois, c est qu’il existe quelque part au fond de la mer un serveur géant dans lequel est stocké toute les informations sur les internautes et leurs activités

    peut etre les datacenter seraient liés a ces serveur qui appartient à sa.tan

    faite attention car les démon nous veulent du mal

  21. al  Surfe sur Safari Safari 525.18 avec Mac OS X Mac OS X 10.4.11
    26 avril 2008 @ 18:55
    21

    super billet a propos de google, merci bien :)

    al.

  22. maiwenn89  Surfe sur Mozilla Firefox Mozilla Firefox 3.0b5 avec Windows Windows XP
    27 avril 2008 @ 17:24
    22

    Merci pour cet article super intéressant.
    :yes: :yes:

    Maiwenn

  23. Le blog d’Alfred » Blog Archive » L’infrastructure utilisée par Google, le géant de la recherche sur le web  Surfe sur WordPress WordPress 2.5
    30 avril 2008 @ 14:04
    23

    […] La suite ici : http://www.papygeek.com/web/google-un-mystere-fascinant-et-bien-garde/ […]

  24. daria  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.11 avec Linux Linux
    04 mai 2008 @ 10:59
    24

    Très instructif : merci ! Beau boulot :thumbsup:

  25. Lu, Vu, Entendu : Episode 8  Surfe sur WordPress WordPress 2.3
    04 mai 2008 @ 11:58
    25

    […] : un mystère fascinant et bien gardé lu sur Papy Geek : même s'il ne s'agit pas d'un nouveau site à découvrir, je suis sûr que vous […]

  26. Tom  Surfe sur Mozilla Firefox Mozilla Firefox 2.0.0.14 avec Windows Windows Vista
    10 mai 2008 @ 19:11
    26

    Je suis d’accord avec les réactions de certains : Google peut faire peur vu l’ampleur qu’il prend.
    Mais Google, c’est aussi une entreprise qui permet à plein de personnes de vivre par le biais de la publicité, qui encourage une certaine qualité de contenu sur le web via son système de recherche, …
    Il y a des bons et des mauvais cotés, comme partout.

  27. The Lord of the Pings | Courir Longtemps  Surfe sur WordPress WordPress 2.5.1
    11 mai 2008 @ 12:32
    27

    […] J’ai passé ma soirée d’hier à lire cet article : Google, un mystère fascinant et bien gardé. […]

  28. the inconnu  Surfe sur WordPress WordPress 4.01
    07 juin 2008 @ 5:50
    28

    […] cet inconnu …Un bel article sur google et quelques uns de ces secrets.http://www.papygeek.com/web/google-un-mystere-fascinant-et-bien-garde/Athlaen the Inconnu Paladin pictures from digital art photos on …Athlaen the inconnu Paladin […]

  29. Mike  Surfe sur Internet Explorer Internet Explorer 7.0 avec Windows Windows XP
    17 juin 2008 @ 1:03
    29

    Bonjour!

    Je tient a vous préciser que Google est partie d’une idées qui a été perfectionner avec le temps, faut pas commencer a croire que Google est une secte ou un monstre, ce n’est seulement qu’une entreprise qui est partie de rien et qui maintenant avec de l ardeur et beaucoup de travail ont réussi.

    Venez pas me dire que vous avez peur que Google vous hante la nuit, ou qu’il peuvent voler votre identité.

    Grâce a vous aujourd’hui je me suis beaucoup amuser a vous lire, et de voir que beaucoup de personnes ont l ‘imagination fertile.

  30. A propos de Google « Web.java  Surfe sur WordPress WordPress MU
    28 juillet 2008 @ 17:44
    30

    […] http://www.papygeek.com/web/google-un-mystere-fascinant-et-bien-garde/ […]

  31. Christine  Surfe sur Internet Explorer Internet Explorer 7.0 avec Windows Windows XP
    20 août 2008 @ 5:18
    31

    Google a TOUT d’une secte. Sous le prétexte de la créativité on y engage que des jeunes donc, des employés assurément plus malléables à l’esprit commun. On peut y vivre sa vie : Manger, faire son lavage, y avoir ses loisirs et tout ses nombreux amis comme dans une secte. Les collègues de travail seront exempts d’appartenance à une nation commune… Google devenant ainsi la nationalité des employés. On y a arbore un suprême commandement moralisateur : «Ne faites pas le mal» (devise tout à fait RELIGIEUSE de Google). Et que dire de ce babillard montré dans le film et qui est tout aussi donneur de leçon de morale : Soyez solidaires, saluez-vous, communiquez, créez des liens. Infantilisant non ? On dirait une maman à son petit garçon. Google est maintenant là pour nous montrer à vivre et à nous aimer les uns les autres. Et que dire de ce «crucifix» arboré par chaque membre de la secte. Cette fameuse lampe «phallique» symbole lumineux-à-la-gélatine. Véritable crie de ralliement en un symbole commun d’appartenance au dieu de la technologie, petit frère de Big Brother au panthéon des illusions humaines.

  32. Jerommme  Surfe sur Mozilla Firefox Mozilla Firefox 3.0.1 avec Windows Windows XP
    08 septembre 2008 @ 1:05
    32

    Google a des secrets industriels que l’on peut pourtant trouver en regardant les documents de brevets qui expliquent un peu mieux la techno. :woot:

    C’est le cas pour le crawling par exemple:
    http://minilien.com/?fDYZ8lDuV4

    Pour le datacenter Français de Google, une info est sortie y a peu: http://minilien.com/?9Qr70NirEA

    SI on en croit ce que nous disent ces gens, Google aurait donc posé quelques serveurs chez monsieur le Neuf à Courbevoie… intox ou info? :getlost:

  33. openstark » Visite d’un datacenter de Google  Surfe sur WordPress WordPress 2.7.1
    17 mai 2009 @ 23:11
    33

    […] informations sur les DataCenters de Google sont plutôt rares. C’est donc avec plaisir que l’on retrouve ces vidéos mise en ligne à […]

  34. QUI POSSÈDE LE PLUS GRAND NOMBRE DE SERVEURS  Surfe sur WordPress WordPress 2.9.2
    15 avril 2010 @ 16:32
    34

    […] Voici un graphique montrant qui possède le plus de serveurs dédiés dans le monde. Et devinez qui est le gagnant ? Google bien sûr. […]

  35. Expedia  Surfe sur Mozilla Firefox Mozilla Firefox 3.6.17 avec Ubuntu Linux Ubuntu Linux
    09 mai 2011 @ 21:18
    35

    Ce n’est pas très étonnant.
    En même temps, s’il est tant utilisé, c’est que la qualité des résultats est bonne!
    Et donc que les capacités des serveurs de calculs est forcéement importante

  36. Letoine  Surfe sur Google Chrome Google Chrome 16.0.912.75 avec Windows Windows 7
    23 janvier 2012 @ 15:48
    36

    Merci de cet article intéressant !

Quand la mouche Tse-Tse pique PapyGeek, elle s'endort aussitôt. +