The first idea of Larry Page (one of the creator of Google) when making his
PhD thesis was to « explore the mathematical properties of the World Wide Web,
understanding its link structure as a huge graph ».
Without knowing it I went a bit in the same direction evaluating how to get
the best out of the web.
I hope I will keep moving forward on this topic and maybe one day set up a
correct theory on the subject.
dimanche 1 février 2009
samedi 24 janvier 2009
Melzoo: Moteur de recherches visuel
Ça me fait plaisir de pouvoir vous écrire un article qui vaut la peine d'être lu après tous ces jours d'absence. Depuis le temps que j'étudie le monde des moteurs de recherches je vois enfin avec Melzoo une hypothétique porte de sortie pour Google.
Je dis hypothétique car la route est encore bien longue mais Melzoo je pense va vous convaincre aussi que l'ère des moteurs de recherches va bientôt être chamboulé.
Alors je parle je parle mais de quoi s'agit il? Et bien Melzoo est un méta moteur de recherches qui vous affiche dans la partie gauche les résultats de la requête que vous avez tapé et dans la colonne de droite vous offre un aperçu du site dont vous avez passé le curseur de la souris sur.
Tout cela se fait à travers la technologie "thumbnail". Hônnetement quand je vois cela je me dis que bon ce n'était pas impossible à faire mais bon après il y a penser et faire. Penser c'est bien mais c'est encore mieux si c'est fait.
La page d'accueil de Melzoo
Je dis hypothétique car la route est encore bien longue mais Melzoo je pense va vous convaincre aussi que l'ère des moteurs de recherches va bientôt être chamboulé.
Alors je parle je parle mais de quoi s'agit il? Et bien Melzoo est un méta moteur de recherches qui vous affiche dans la partie gauche les résultats de la requête que vous avez tapé et dans la colonne de droite vous offre un aperçu du site dont vous avez passé le curseur de la souris sur.
Tout cela se fait à travers la technologie "thumbnail". Hônnetement quand je vois cela je me dis que bon ce n'était pas impossible à faire mais bon après il y a penser et faire. Penser c'est bien mais c'est encore mieux si c'est fait.

J'ai été assez surpris de la rapidité d'affichage des aperçus des sites, peut être qu'à ce moment là ma connexion était rapide mais l'affichage est quasi instantané ce qui est assez épatant.
Après pour ceux qui ont un petit débit sur leur connexion il faut voir si le moteur est encore exploitable.
Les inconvénients de Melzoo (et oui car il n'y a pas que du positif) sont que c'est un méta moteur. Un méta moteur c'est bien ça peut être utile mais certainement pas sur une page qui vous affiche que dix résultats. Deuxième point il ne nous explique pas quels sont les moteurs qu'il utilise dans son méta moteur (ou du moins je ne l'ai pas vu écrit). Je devine qu'il y a du Yahoo car les résultats y sont très très similaires.
Un autre inconvénient est la sempiternelle rubrique "about us" qui décrit Melzoo comme le moteur qui va tout arracher sur son passage:
"MelZoo does possess the intrinsic qualities and has the potential to become number 1 in the "Search" market, thanks to a much better user experience and higher quality traffic for advertisers. Both the visitor and the advertiser benefit!"
et on aime beaucoup la phrase "grâce à une bien meilleure expérience et un traffic de haute qualité".
Je ne pense pas que Melzoo sera demain le meilleur moteur du marché. La première raison c'est que les résultats des requêtes ne sont pas encore au point et que si ils veulent faire du méta moteur il va falloir revoir l'affichage des résultats ou les rendre public en expliquant d'où ils viennent.
La deuxième raison c'est que l'avenir n'est pas aux moteurs de recherches globaux mais aux moteurs de recherches spécialisés. (Par ailleurs c'est une chance pour nous les opérateurs booléens fonctionnent sur Melzoo). Du coup je ne vois qu'en Melzoo un concept qui devrait être ajouté au plus grand.
En tout cas je vous le conseille à l'essai car il est assez impressionnant, donc un bon concept mais ce n'est qu'une petite pièce du puzzle des moteurs de recherches.
Après pour ceux qui ont un petit débit sur leur connexion il faut voir si le moteur est encore exploitable.
Les inconvénients de Melzoo (et oui car il n'y a pas que du positif) sont que c'est un méta moteur. Un méta moteur c'est bien ça peut être utile mais certainement pas sur une page qui vous affiche que dix résultats. Deuxième point il ne nous explique pas quels sont les moteurs qu'il utilise dans son méta moteur (ou du moins je ne l'ai pas vu écrit). Je devine qu'il y a du Yahoo car les résultats y sont très très similaires.
Un autre inconvénient est la sempiternelle rubrique "about us" qui décrit Melzoo comme le moteur qui va tout arracher sur son passage:
"MelZoo does possess the intrinsic qualities and has the potential to become number 1 in the "Search" market, thanks to a much better user experience and higher quality traffic for advertisers. Both the visitor and the advertiser benefit!"
et on aime beaucoup la phrase "grâce à une bien meilleure expérience et un traffic de haute qualité".
Je ne pense pas que Melzoo sera demain le meilleur moteur du marché. La première raison c'est que les résultats des requêtes ne sont pas encore au point et que si ils veulent faire du méta moteur il va falloir revoir l'affichage des résultats ou les rendre public en expliquant d'où ils viennent.
La deuxième raison c'est que l'avenir n'est pas aux moteurs de recherches globaux mais aux moteurs de recherches spécialisés. (Par ailleurs c'est une chance pour nous les opérateurs booléens fonctionnent sur Melzoo). Du coup je ne vois qu'en Melzoo un concept qui devrait être ajouté au plus grand.
En tout cas je vous le conseille à l'essai car il est assez impressionnant, donc un bon concept mais ce n'est qu'une petite pièce du puzzle des moteurs de recherches.
lundi 19 janvier 2009
Scirus: Le moteur de recherches par excellence
Salut à tous,
Et oui je sais on ne me voit plus beaucoup en ce moment mais il faut dire que je travaille d'arrache pied sur ma thèse et que du coup je n'ai plus le temps de griffonner quelques lignes pour vous faire part de mes recherches.
La dernière en date que j'ai est celle de Scirus que peut être certains d'entre vous connaissent si ce n'est pas le cas lisez bien attentivement cet article.
J'ai découvert ce moteur en étudiant le questionnaire relatif à la formation des doctorants en Bretagne en recherche d'information. Si le rapport de cette étude vous intéresse il est disponible au lien suivant: http://www.uhb.fr/urfist/enquete_besoins_formation_doctorants-maitrise_information.
La conclusion est simple: la situation est grave mais bon revenons en à nos moutons et parlons de Scirus.
Scirus est présent dans la question concernant la connaissance sur les moteurs de recherches spécialisés. Scirus se décrit comme:
"is the most comprehensive scientific research tool on the web. With over 450 million scientific items indexed at last count, it allows researchers to search for not only journal content but also scientists' homepages, courseware, pre-print server material, patents and institutional repository and website information. "
"le moteur le plus apte pour la recherche scientifique sur le Web. Avec plus de 450 millions de sources scientifiques indexées, il permet aux chercheurs de trouver non seulement des articles mais aussi des sites Internet de scientifiques, des plans de cours, des documents sur des serveurs prêt à être imprimer, des brevets et dépôts ainsi que des informations sur les sites Internet."
Bref un filtre parfait pour vous évitez tous les blogs et autres contenus de basse qualité. C'est surtout un bonne outil pour trouver des thèses. Le moteur étant en anglais je pense qu'il est plus facile de savoir bien parler la langue de Shakespeare pour trouver son bonheur. Dans mon cas je l'ai trouvé sans trop de soucis alors que Google ne me permettait pas de mettre la main dessus.
A conseiller et à mettre dans vos favoris de toute urgence pour vos travaux de recherches.
Et oui je sais on ne me voit plus beaucoup en ce moment mais il faut dire que je travaille d'arrache pied sur ma thèse et que du coup je n'ai plus le temps de griffonner quelques lignes pour vous faire part de mes recherches.
La dernière en date que j'ai est celle de Scirus que peut être certains d'entre vous connaissent si ce n'est pas le cas lisez bien attentivement cet article.
J'ai découvert ce moteur en étudiant le questionnaire relatif à la formation des doctorants en Bretagne en recherche d'information. Si le rapport de cette étude vous intéresse il est disponible au lien suivant: http://www.uhb.fr/urfist/enquete_besoins_formation_doctorants-maitrise_information.
La conclusion est simple: la situation est grave mais bon revenons en à nos moutons et parlons de Scirus.
Scirus est présent dans la question concernant la connaissance sur les moteurs de recherches spécialisés. Scirus se décrit comme:
"is the most comprehensive scientific research tool on the web. With over 450 million scientific items indexed at last count, it allows researchers to search for not only journal content but also scientists' homepages, courseware, pre-print server material, patents and institutional repository and website information. "
"le moteur le plus apte pour la recherche scientifique sur le Web. Avec plus de 450 millions de sources scientifiques indexées, il permet aux chercheurs de trouver non seulement des articles mais aussi des sites Internet de scientifiques, des plans de cours, des documents sur des serveurs prêt à être imprimer, des brevets et dépôts ainsi que des informations sur les sites Internet."
Bref un filtre parfait pour vous évitez tous les blogs et autres contenus de basse qualité. C'est surtout un bonne outil pour trouver des thèses. Le moteur étant en anglais je pense qu'il est plus facile de savoir bien parler la langue de Shakespeare pour trouver son bonheur. Dans mon cas je l'ai trouvé sans trop de soucis alors que Google ne me permettait pas de mettre la main dessus.
A conseiller et à mettre dans vos favoris de toute urgence pour vos travaux de recherches.
samedi 17 janvier 2009
CV Gadget: Un moteur à combiner avec 123 people
CV gadget est un moteur de recherches dédié à la recherche de personnes sur Internet. Son fonctionnement est très simple en indiquant le prénom et le nom d'une personne l'application va chercher toutes les données sur la personne en question à travers Google, Facebook, Myspace, Zoominfo, Xing, LinkedIn, Bebo et imeem.
CV Gadget comme son nom peut le faire deviner est un moteur de recherches ayant pour but d'aider à découvrir si oui ou non le CV que le responsable des ressources humaines a dans la main est bidon ou non.
Je suis un peu mauvaise langue en annonçant que c'est le moteur de recherches préféré des recruteurs mais pourtant c'est bien l'ambition de cette application informatique:
"CVGadget.com - Person Search Engine, quick cv and resume check for HR research."
qui comme indiqué dans sa description a pour but pour le personnel des ressources humaines de vérifier les curriculum des personnes.
L'outil en question est assez puissant si l'on y réfléchit bien d'autant plus qu'il trouve des informations que ne trouve pas 123people que je vous avais présenté il y a quelque temps(et vice versa).
En résumé en associant CV gadget et 123people on obtient un joli petit cocktail de données.
L'application en question est très simple à utiliser il suffit d'indiquer le prénom et le nom et la recherche est lancée.
La page d'accueil de CV Gadget
CV Gadget comme son nom peut le faire deviner est un moteur de recherches ayant pour but d'aider à découvrir si oui ou non le CV que le responsable des ressources humaines a dans la main est bidon ou non.
Je suis un peu mauvaise langue en annonçant que c'est le moteur de recherches préféré des recruteurs mais pourtant c'est bien l'ambition de cette application informatique:
"CVGadget.com - Person Search Engine, quick cv and resume check for HR research."
qui comme indiqué dans sa description a pour but pour le personnel des ressources humaines de vérifier les curriculum des personnes.
L'outil en question est assez puissant si l'on y réfléchit bien d'autant plus qu'il trouve des informations que ne trouve pas 123people que je vous avais présenté il y a quelque temps(et vice versa).
En résumé en associant CV gadget et 123people on obtient un joli petit cocktail de données.
L'application en question est très simple à utiliser il suffit d'indiquer le prénom et le nom et la recherche est lancée.

J'ai été personnellement agréablement surpris des informations qu'il pouvait trouver car un peu plus nombreuse que sur 123 people.
Par ailleurs pour ceux qui suivent l'actualité sur le risque de mettre des informations personnelles sur Internet, je vous conseille le lien suivant qui atterrit sur un site dont les personnes qui le gère ont décidé d'étaler la vie d'un Internaute pris au hasard sur le net. L'article fait assez peur.
Par ailleurs pour ceux qui suivent l'actualité sur le risque de mettre des informations personnelles sur Internet, je vous conseille le lien suivant qui atterrit sur un site dont les personnes qui le gère ont décidé d'étaler la vie d'un Internaute pris au hasard sur le net. L'article fait assez peur.
jeudi 15 janvier 2009
Yabêêê: Mon moteur de recherches personnalisé
L'application Customize Search Engine de Google est la preuve que le moteur de recherches du même nom est la victime de son succès.
Allez c'est partit je vous explique à la va vite le principe de Google Customize Search Engine.
Cela consiste à créer votre propre moteur de recherches dans mon cas c'est Yabêêê.
Comme vous pouvez le voir dans la colonne de droite j'ai même pu me faire ma propre masquotte.
Le principe de GCSE est assez simple même si c'est un peu la croix et la bannière pour mettre de la publicité. Il vous suffit de vous rendre sur le site suivant: www.google.com/cse et à partir de là vous choisissez les critères de votre moteur de recherches.
En gros vous lui dites quels sont les sites que vous aimeriez qu'ils visitent et Google s'occupe du reste.
Dans mon cas je lui ai dit de ne chercher des informations que dans mes blogs personnels.
Le résultat des recherches est assez impressionnant puisqu'à requête identique votre moteur obtiendra plus de résultats que Google lui même sur les mêmes sites.
Dans mon cas j'ai utilisé la requête suivante: "prénom+nom" Yabeee me renvoyant 34 résultats sur les sites que je lui avait indiqué alors que Google.com m'en renvoyait seulement 6.
L'explication se trouve dans le fait que Google.com ignorera les résultats qu'il juge dans un premier temps non pertinents(vous aurez cependant la possibilité au final de les réinclure si bon vous semble).
Au final Yabeee nous sert de filtre à Google:
Allez c'est partit je vous explique à la va vite le principe de Google Customize Search Engine.
Cela consiste à créer votre propre moteur de recherches dans mon cas c'est Yabêêê.
Comme vous pouvez le voir dans la colonne de droite j'ai même pu me faire ma propre masquotte.
Le principe de GCSE est assez simple même si c'est un peu la croix et la bannière pour mettre de la publicité. Il vous suffit de vous rendre sur le site suivant: www.google.com/cse et à partir de là vous choisissez les critères de votre moteur de recherches.
En gros vous lui dites quels sont les sites que vous aimeriez qu'ils visitent et Google s'occupe du reste.
Dans mon cas je lui ai dit de ne chercher des informations que dans mes blogs personnels.
Le résultat des recherches est assez impressionnant puisqu'à requête identique votre moteur obtiendra plus de résultats que Google lui même sur les mêmes sites.
Dans mon cas j'ai utilisé la requête suivante: "prénom+nom" Yabeee me renvoyant 34 résultats sur les sites que je lui avait indiqué alors que Google.com m'en renvoyait seulement 6.
L'explication se trouve dans le fait que Google.com ignorera les résultats qu'il juge dans un premier temps non pertinents(vous aurez cependant la possibilité au final de les réinclure si bon vous semble).
Au final Yabeee nous sert de filtre à Google:
lundi 12 janvier 2009
AOL: A quoi sert son moteur de recherches?
Très bonne question n'est ce pas? Je me suis toujours demandé comment cela se faisait il que AOL search en France est si populaire avec 1,4% de part de marché en novembre 2008 selon Xiti Monitor.
Car j'en avais déjà parlé dans un post précédant le moteur d'AOL est un moteur portant la mention "Powered by Google" ce qui signifie que c'est le moteur de Google qui y travaille derrière.
J'ai donc mené ma petite enquête et ai découvert que cette mention "Powered by Google" signifie que c'est la technologie de Google qui est utilisé et qu'ensuite AOL y applique un filtre du genre je veux que mon moteur ne recherche que dans les sites A et B et pas dans C ni D etc.
Vous pouvez vous faire un exemple concret de la chose en créant votre propre moteur via Google customize search. Personnelement je me suis prêté au jeu en créant un moteur pour ce blog, il est disponible dans la colonne de droite ou à l'adresse suivante.
Pour en revenir à AOL si vous effectuez une recherche vous y verrez apparaitre en tant que résultat exactement les mêmes que pour Google sur la première page. Cependant au niveau du nombre de résultats donnés il y en a beaucoup moins(disons que si Google vous renvoit 100,000 résultats AOL vous en renvoit 10,000), le rapport y est de 10%.
Je ne dirai pas qu'AOL est moins pertinent que Google car en réalité personne ne s'aventure au delà de la page 3 des résultats de Google. Je dirai donc qu'AOL est un moteur de Google simplifié. Cependant je remet beaucoup en cause son utilité, je comprends qu'il faille privilégier la qualité au détriment de la qualité mais si les résultats restent les mêmes sur les premières pages sachant que la rapidité des résultats sur les deux moteurs semblent la même je ne vois pas vraiment l'intérêt du filtre.
Car j'en avais déjà parlé dans un post précédant le moteur d'AOL est un moteur portant la mention "Powered by Google" ce qui signifie que c'est le moteur de Google qui y travaille derrière.
J'ai donc mené ma petite enquête et ai découvert que cette mention "Powered by Google" signifie que c'est la technologie de Google qui est utilisé et qu'ensuite AOL y applique un filtre du genre je veux que mon moteur ne recherche que dans les sites A et B et pas dans C ni D etc.
Vous pouvez vous faire un exemple concret de la chose en créant votre propre moteur via Google customize search. Personnelement je me suis prêté au jeu en créant un moteur pour ce blog, il est disponible dans la colonne de droite ou à l'adresse suivante.
Pour en revenir à AOL si vous effectuez une recherche vous y verrez apparaitre en tant que résultat exactement les mêmes que pour Google sur la première page. Cependant au niveau du nombre de résultats donnés il y en a beaucoup moins(disons que si Google vous renvoit 100,000 résultats AOL vous en renvoit 10,000), le rapport y est de 10%.
Je ne dirai pas qu'AOL est moins pertinent que Google car en réalité personne ne s'aventure au delà de la page 3 des résultats de Google. Je dirai donc qu'AOL est un moteur de Google simplifié. Cependant je remet beaucoup en cause son utilité, je comprends qu'il faille privilégier la qualité au détriment de la qualité mais si les résultats restent les mêmes sur les premières pages sachant que la rapidité des résultats sur les deux moteurs semblent la même je ne vois pas vraiment l'intérêt du filtre.
dimanche 11 janvier 2009
Les moteurs de recherches de Google
Comme chacun le sait Google est un immense moteur de recherches et c'est tous les jours que du nouveau contenu sur le web est indexé.
Google se retrouve donc théoriquement jour après jour avec plus de contenu à indexé(bon je ne suis pas sûr que la tâche soit si difficile que cela car je pense que de la même façon que Google indexe des sites il peut en désindexé aussi).
Prenant en compte que la plupart d'entre nous ne connaissent ou n'utilisent pas les opérateurs booléens quand ils font des recherches(+ - near "" ~ etc...) et bien il est un peu normal que le résultat de nos requêtes ne soient pas à la hauteur de ce que l'on en attend.
Pour palier à cela Google a mis au point des moteurs de recherches spécialisés(ce n'est pas nouveau rassurez vous), les plus connu étant Google Images et Google Vidéos.
Je pense sérieusement que ces moteurs spécialisés ne sont rien de plus qu'une requête spéciale de Google du type(mais en plus travaillé):
?intitle:index.of? -filetype:html -filetype:asp -wiki -ringtone -filetype:htm -posts -lyrics -filetype:shtml -filetype:php -filetype:doc -filetype:pdf -filetype:txt jpg gif png
pour chercher des images par exemple.
C'est d'ailleurs pour cela que quand on lance une recherche sous Google images on nous renvoit pas des sites Internet ni même des vidéos mais seulement des images.
Donc dans un soucis de rendre vos recherches plus pertinentes Google a mis en place toute une série de moteurs de recherches spécialisés de manière à ce que vous puissiez y voir plus clair. Il est donc dans votre intérêt de les connaitre pour une recherche ciblée.
Alors naturellement tous ces moteurs ne vous seront pas utiles mais certains pourraient valoir le détour. J'ai vous ai ici fait un schéma simplifié(tous les moteurs de Google n'y sont pas) des moteurs spécialisés de Google:
En fait tous ces moteurs sont répartis je dirai par degré d'utilité et de spécialisation.
Le niveau 1 correspondrait aux moteurs dont n'importe quel utilisateur aurait besoin c'est à dire les images, le shopping, les actualités et la géographie. Ils sont tous disponibles sur la page d'accueil de Google. Le niveau 2 est à peu prêt pareil toujours accessible en page d'accueil mais déjà certains moteurs vous sont peut être inconnu tel que book search et finance.
Le niveau 3 est bien sûr encore un peu plus dur à trouver.
Le niveau 4&5 il faut carrément allé les chercher dans la jungle du web.
La grande question est y a t il des moteurs spécialisés de Google qui valent le coup d'être vu et découvert pour le moment?
A cette question je répondrai non même si en était curieux on peut s'aventurer sur Google Patent(qui recense les brevets déposés du type le brevet de la manette xbox) ou encore Google code pour les programmeurs ou même Google Catalogue qui référence des vieux catalogues d'entreprises.
Google-411 vaut le détour, quel dommage que ce service ne semble disponible qu'aux Etats-Unis:
Google se retrouve donc théoriquement jour après jour avec plus de contenu à indexé(bon je ne suis pas sûr que la tâche soit si difficile que cela car je pense que de la même façon que Google indexe des sites il peut en désindexé aussi).
Prenant en compte que la plupart d'entre nous ne connaissent ou n'utilisent pas les opérateurs booléens quand ils font des recherches(+ - near "" ~ etc...) et bien il est un peu normal que le résultat de nos requêtes ne soient pas à la hauteur de ce que l'on en attend.
Pour palier à cela Google a mis au point des moteurs de recherches spécialisés(ce n'est pas nouveau rassurez vous), les plus connu étant Google Images et Google Vidéos.
Je pense sérieusement que ces moteurs spécialisés ne sont rien de plus qu'une requête spéciale de Google du type(mais en plus travaillé):
?intitle:index.of? -filetype:html -filetype:asp -wiki -ringtone -filetype:htm -posts -lyrics -filetype:shtml -filetype:php -filetype:doc -filetype:pdf -filetype:txt jpg gif png
pour chercher des images par exemple.
C'est d'ailleurs pour cela que quand on lance une recherche sous Google images on nous renvoit pas des sites Internet ni même des vidéos mais seulement des images.
Donc dans un soucis de rendre vos recherches plus pertinentes Google a mis en place toute une série de moteurs de recherches spécialisés de manière à ce que vous puissiez y voir plus clair. Il est donc dans votre intérêt de les connaitre pour une recherche ciblée.
Alors naturellement tous ces moteurs ne vous seront pas utiles mais certains pourraient valoir le détour. J'ai vous ai ici fait un schéma simplifié(tous les moteurs de Google n'y sont pas) des moteurs spécialisés de Google:

Le niveau 1 correspondrait aux moteurs dont n'importe quel utilisateur aurait besoin c'est à dire les images, le shopping, les actualités et la géographie. Ils sont tous disponibles sur la page d'accueil de Google. Le niveau 2 est à peu prêt pareil toujours accessible en page d'accueil mais déjà certains moteurs vous sont peut être inconnu tel que book search et finance.
Le niveau 3 est bien sûr encore un peu plus dur à trouver.
Le niveau 4&5 il faut carrément allé les chercher dans la jungle du web.
La grande question est y a t il des moteurs spécialisés de Google qui valent le coup d'être vu et découvert pour le moment?
A cette question je répondrai non même si en était curieux on peut s'aventurer sur Google Patent(qui recense les brevets déposés du type le brevet de la manette xbox) ou encore Google code pour les programmeurs ou même Google Catalogue qui référence des vieux catalogues d'entreprises.
Google-411 vaut le détour, quel dommage que ce service ne semble disponible qu'aux Etats-Unis:
Inscription à :
Articles (Atom)