samedi 28 mars 2009

L'imprimante jet d'encre Lego de Larry Page

Je ne sais pas si cet article interessera quelqu'un mais on lit souvent dans les articles sur Larry Page l'un des fondateurs de Google qu'il a mis au point lors de ses études une imprimante à jet d'encre à partir de briques de Lego.
On en entend donc beaucoup parler mais très rarement on en voit des photos.
Je me suis donc mis en quête de quelques photos car personnelement moi ça m'intéresse de savoir à quoi ressemble une telle imprimante.
La seule que j'ai pu trouver jusqu'à présent est celle ci:

et même si je pense que cette imprimante est de Larry Page je n'en suis pas sûr à 100% car la source de l'image n'était pas très bien indiqué.
Je n'ai en revanche pas encore trouvé de guide d'utilisation ni de mode d'emploi pour la construction.

mardi 24 mars 2009

Les parts de marché de Google dans le monde

Zorgloob vient de publier un article très intéressant sur les parts de marché de Google dans le monde.
Je tiens à saluer leur travail que je trouve très complet et intéressant.
C'est marrant car je m'étais lancé exactement dans la même tache il y a quelques mois de cela et n'avait pas publié mes résultats car je me disais qu'il valait mieux vous présenter les marchés les plus intéressants et individuellement plutôt qu'un topo général de la situation.
C'est dommage en tout cas car il semblerait que j'avais exactement la même idée et que pour une fois j'étais très en avance (à la seule différence qu'ils en ont trouvé 3 de plus).
En tout cas voici le tableau que vous obtiendrez à l'adresse suivante:

PaysPdMDateInstitut
Allemagne93,0%mars 2008
Argentine89,0%janv. 2008comScore
Australie87,8%juin 2008Hitwise
Autriche88,0%janv. 2008comScore
Belgique95,0%mars 2009comScore
Brésil89,0%janv. 2008comScore
Bulgarie80,0%déc. 2007Multilingual search
Canada78,0%janv. 2008comScore
Chili93,0%janv. 2008comScore
Chine26,6%oct. 2008iResearch
Colombie91,0%janv. 2008comScore
Corée du Sud3,0%janv. 2009
Danemark92,0%janv. 2008comScore
Espagne93,0%janv. 2008comScore
Estonie53,4%juil. 2008Gemius SA
États-Unis63,3%sept. 2009comScore
États-Unis72,1%sept. 2009Hitwise
Finlande92,0%janv. 2008comScore
France91,2%févr. 2009AT Internet Institute
Hong Kong26,0%janv. 2008comScore
Hongrie96,0%août 2008
Inde81,4%août 2008comScore
Irlande76,0%janv. 2008comScore
Islande51,0%déc. 2007
Israël80,0%janv. 2007
Italie90,0%févr. 2009
Japon38,2%janv. 2009Nielsen/NetRatings
Lettonie98,0%juil. 2008Gemius SA
Lituanie98,2%sept. 2008Gemius SA
Malaisie51,0%janv. 2008comScore
Mexique88,0%janv. 2008comScore
Norvège81,0%janv. 2008comScore
Nouvelle-Zélande72,0%janv. 2008comScore
Pays-Bas95,0%déc. 2008
Pologne89,3%sept. 2007Gemius SA
Porto Rico57,0%janv. 2008comScore
Portugal94,0%janv. 2008comScore
République Tchèque34,5%mars 2009
Roumanie95,2%mars 2009statcounter.com
Royaume-Uni90,4%déc. 2008Hitwise
Russie32,0%janv. 2008Spylog
Singapour57,0%janv. 2008comScore
Slovaquie75,6%déc. 2007
Suède80,0%janv. 2008comScore
Suisse93,0%janv. 2008comScore
Taiwan18,0%janv. 2008comScore
Ukraine72,4%févr. 2009Bigmir-Internet
Vénézuela93,0%janv. 2008comScore
J'aimerais attirer votre attention sur les sources ainsi que les dates des mises à jour qui sont pour moi très très intéressantes.
Je n'ai pas vraiment de surprise en ce qui concerne les résultats qui y sont affichés qui montrent clairement ce que je met en avant depuis le début des mes recherches.
Nous avons dans le monde un bloc Americo-Européen et le reste du monde.
Quand je dis le reste du monde c'est l'Asie qui elle même est divisée en plein de petits mondes.
Alors attention car on prend souvent l'Asie pour un continent, au niveau géographique peut être mais en ce qui concerne ce que j'appelerai le E-world on se retrouve avec des micros continents de part et d'autres. C'est à croire que des pays comme la Corée du Sud vivent en véritable autarcie au niveau des moteurs de recherches.

Revenons au tableau en lui même, comme vous pouvez le voir les pays en rouge ou très proche du rouge (<50%)>
Taiwan, Singapour, la Malaisie, le Japon, Honk Kong, l'Islande, la Corée du Sud, la Chine et la Russie.

Pour ceux qui suivent l'histoire de mon blog ce n'est pas la surprise du siècle de retrouver ces pays n'ayant pas encore adopter la norme Google.

Pour information voici ce que j'ai appris lors de mon dernier cours de Knowledge Management: "un produit ou service devient un standard quand il acquiert plus de 50% de parts de marché."

En résumé à chaque fois que Google franchit la barre des 50% c'est un pays de gagné et la tendence ne peut s'inverser.

Je disais donc que ce n'est pas un hasard de retrouver les groupes suivants:
- Taiwan, Singapour, la Malaisie, le Japon, Honk Kong que j'appelerai pour simplifier les dragons et les tigres, il s'agit pour moi d'un groupe ayant des influences anglo-saxonnes (Yahoo leader du marché des moteurs de recherches dans cette zone) sur leur façon de surfer mais qui ont une culture qui leur est propre que je qualifierai d'asiatique c'est à dire qu'un site Internet doit être esthétique avant tout;

- L'Islande qui est un pays que je trouve impressionnant. Une faible population et une langue que même Google ne traduit pas encore mais 7 personnes sur 10 ont Internet. Ici je dirai que Google a un mal terrible à entrer dans ce marché à cause de la langue;

- La Coréee du Sud qui est le pays le plus fermé aux moteurs de recherches étrangers;

- La Chine dont j'ai déjà parlé précedemment;

- La Russie dont j'ai aussi parlé précedemment;

La Malaisie et Taiwan sont deux marchés que j'aurais grand plaisir à étudier quand j'aurais un peu plus de temps.

dimanche 1 février 2009

Rapport intermédiaire de thèse

Salut à tous,

Comme promis je vous publie mon rapport intermédiaire de thèse.
Pour le télécharger cliquez sur le lien suivant (mais il vous faudra un compte gratuit sur slideshares):
Lien pour la thèse
Le rapport final est prévu pour juin.
Bonne lecture.

Risks of search engine dependency and its influence on data quality

Thesis intermediate report submitted for the European Master in Business Studies
(EMBS)
by Ronan CHARDONNEAU
Institut de Management de l'Université de Savoie d'Annecy (FR)
Università degli studi di Trento (IT)
Universität Kassel (GER)
Universidad de León (SP)
Date of submission: 26th January, 2009
Master Thesis

Contents

Foreword.......................................................................................................................6
Chapter 1: Introduction of the topic background..........................................................8
1.1 Relevance of the subject...................................................................................10
1.2 Major terms......................................................................................................11
1.3 Focus, goals and structure of the report...........................................................11
Chapter 2: Concept of data quality.............................................................................13
2.1 Data quality definition......................................................................................14
2.2 The importance of data quality.........................................................................15
Chapter 3: Search engines dependency.......................................................................16
3.1 Search engine market configuration.................................................................17
3.1.1 Search engine categories..........................................................................17
3.1.2 Search engine market...............................................................................19
3.1.3 The search engines in the world...............................................................19
3.1.4 The search engine market shares per country...........................................22
3.1.5 The search engines competition...............................................................23
3.1.6 The semantic web.....................................................................................24
3.2 Search engines dependency aspect...................................................................25
3.2.1 Search engines dependency proves..........................................................25
3.2.2 Search engines dependency aspect...........................................................27
3.3 Search engines dependency problems..............................................................28
3.3.1 Privacy issues...........................................................................................29
3.3.2 Looking for other search engines.............................................................30
3.3.3 Search engine awareness..........................................................................30
3.3.4 Other search engines existence awareness...............................................32
3.3.5 Less confident regarding other search engines.........................................33
3.3.5 Less confident regarding other search engines.........................................33
3.3.6 Even the best cannot provide you everything...........................................34
Chapter 4: Risks of search engines dependency and its influence on data quality.....35
4.1 The information has been found but is poor....................................................36
4.2 What the search engines do not tell you...........................................................36
4.3 The best way to get data quality.......................................................................37
4.3.1 The sub-search engines.............................................................................37
4.3.2 The size of the Internet.............................................................................38
4.3.3 Single search engine Internet coverage....................................................39
4.3.4 Multiple search engine Internet coverage.................................................42
4.3.5 Others search engine Internet coverage....................................................44
4.3.6 A concrete representation of the World Wide Web...................................46
4.4 The gap between search engine dependency and data quality.........................47
Chapter 5: The Google example.................................................................................50
5.1 Google..............................................................................................................51
5.2 Google's success...............................................................................................51
5.3 Google dependency state..................................................................................52
5.4 Google functions..............................................................................................52
5.5 Google added functionalities............................................................................53
5.6 Google success is his weakness.......................................................................53
5.7 Google's disappearance hypothesis..................................................................54
Conclusion..................................................................................................................55
Declaration..................................................................................................................56
List of literature...........................................................................................................57
Afterword....................................................................................................................61

Foreword

As most of the students who has a computer one of my first move when I
wake up is to switch on the computer and to spend my first twenty minutes of the day
on the Internet.
From there I have a look at the last news, I check my e-mails and eventually
exchange some few words with a couple of friends by using online chat applications.
I also check my other email account as well as my blogs and analyze the traffic I got
during the last few days, to finish this process I consult my advertisement account to
see if I got some revenues. I often use as well search engine to look for information
which just came up into my mind during the night.
In the paragraph you just read was the description of my morning routine on
Internet. There is nothing special except that most of the moves I described above are
in fact done on two to three major search engines: Google, Yahoo and Microsoft.
I hardly ever use Yahoo or Microsoft for search purpose but Google is for
sure the website I visit the most to crawl the web but... is Google the Internet?
I got the idea to write about: « Risks of search engine dependency and its
influence on data quality » not because I was using all those Google applications
everyday and was scared about what will happen if I get in troubles with Google
such as privacy issues or if Google just closed. I just write about it because one day I
found Google results not accurate enough.
And from this observation a lot of questions came to my mind:
· Is it me who is not good enough at performing research on the Internet?
· Is it because no one wrote about the information I am looking for?
· Is it because the information is not on the first pages in Google that I have to
browse all the pages in order to find it?
· Is it because Google is not good enough?
· Is it because the information is hidden in some other documents such as PDF,
pictures, videos?
· Is it because I have to use another way to crawl the web and if yes how?
You see here how a simple observation can raise a lot of questions.
I hesitated a lot about writing on this topic, the main problem I got was that I
was not convinced that there is a potential risk of being search engine dependent. The
reason is that companies such as Google are working hard in order to fit Internet
users expectations and the vision we get is that they are doing a wonderful work. The
problem is that there could be a difference between perception and real facts and this
is exactly what I am eager to discover here.
Can we measure how huge is the gap between the information we were
looking for and the one of search engines as Google are providing us?
Search engines are set up to find information on the Internet, information
being the basis of any good decisions making we can then understand how important
and interesting it is to write on this topic.
I hope you will appreciate this reading as much as I did when making my
research.

Chapter 1: Introduction of the topic background

I will not surprise you if I say that Internet has been created to share
information and to communicate with each others.
It is hard to evaluate how big is the Internet, estimations among companies
are very different, it varies from 15 to some 30 billion Web pages1. The number of
websites is increasing everyday and estimated at 185,167,8972 with a constant
augmentation since the creation of the world wide web.


Illustration 1: Total Sites Across All Domains August 1995 - January 2009

Habits have changed since the creation of the Internet and websites are used now in
diverse manners if it comes to be a standard for companies (recognized as a mark of
trust, seriousness and quality) it is also a space for many individuals (blog
phenomenon). As an example regarding France, in June 2008 14% of French people
above 12 year-old which means 22% of French Internet users are authors of a blog or
a website3.
The banalization of the Internet and the fact that anyone can create his own
website for free increase the feeling we have regarding the Internet: a true jungle of
information and even sometimes real “dump” regarding information accuracy.
Websites can be accessible through three channels:
· Direct access (for example you know the website address by heart, you put it
in your favorites or you find a website on a business card and you are typing
it in the address bar);
· External links (you access to a website which has the link of another
website, this is the case in most of websites, catalogs, advertisement);
· Through Search Engines (you use a dedicated application by typing in some
keywords in order to get suggestions of what you are looking for);
As you can see from this list if you use only the first two ways to crawl the
web it comes to be too rigid and not wide enough. It has been said as well that the
first way is disappearing more and more in profit of search engines4.
So one could say that there is currently two main ways to crawl the web, from
link to link and by using search engine.
This last one being indispensable in order to crawl the web properly.
More and more information are put on the Internet which makes it
come a true jungle. The only way to crawl those information properly
is to use search engines.