<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet title="XSL formatting" type="text/xsl" href="http://www.valiz.org/blog/index.php/feed/rss2/xslt" ?><rss version="2.0"
  xmlns:dc="http://purl.org/dc/elements/1.1/"
  xmlns:wfw="http://wellformedweb.org/CommentAPI/"
  xmlns:content="http://purl.org/rss/1.0/modules/content/">
<channel>
  <title>Valiz : Moteur de recherche open-source - contribuer</title>
  <link>http://www.valiz.org/blog/index.php/</link>
  <description>Blog francophone du développement du projet de moteur libre Valiz.</description>
  <language>fr</language>
  <pubDate>Sun, 19 Oct 2008 12:11:06 +0200</pubDate>
  <copyright>Le contenu de ce blog peut être copié à condition de citer la source avec un lien en dur.</copyright>
  <docs>http://blogs.law.harvard.edu/tech/rss</docs>
  <generator>Dotclear</generator>
  
    
  <item>
    <title>Compte-rendu de la discussion jabber du 18 octobre 2008</title>
    <link>http://www.valiz.org/blog/index.php/post/2008/10/19/Compte-rendu-de-la-discussion-jabber-du-18-octobre-2008</link>
    <guid isPermaLink="false">urn:md5:85a1225302828bd552d8e6ed755210a3</guid>
    <pubDate>Sun, 19 Oct 2008 11:56:00 +0200</pubDate>
    <dc:creator>Reivilo</dc:creator>
        <category>Généralités</category>
        <category>accessibilité</category><category>contenu</category><category>contribuer</category><category>index</category><category>jabber</category><category>serveur</category><category>sémantique</category><category>valiz</category><category>W3C</category>    
    <description>    &lt;p&gt;J'ai été invité par le salon &lt;a href=&quot;http://www.valiz.org/blog/index.php/post/2008/10/19/exalead@chat.jabberfr.org&quot; hreflang=&quot;fr&quot;&gt;exalead de JabberFR&lt;/a&gt; à venir discuter de Valiz et plus généralement du principe d'un moteur de recherche open-source. Cela s'est donc déroulé hier, samedi 18 octobre 2008 de 20h30 à 22h30. J'ai décidé d'en faire un compte-rendu ici ce qui permet de faire le point sur l'état du projet mais aussi d'informer les absents.&lt;br /&gt;&lt;/p&gt;

&lt;h2&gt;L'indexation et le contenu&lt;/h2&gt;

&lt;p&gt;Nous avons parlé de la cible de Valiz, le contenu accessible. Indexer uniquement des sites pleinement conformes aux recommandation sur l'accessibilité est illusoire, il y en a trop peu. Mieux vaut se concentrer sur des sites faisant des efforts d'accessibilité.&lt;/p&gt;

&lt;h2&gt;Un moteur modulaire&lt;/h2&gt;

&lt;p&gt;L'intérêt d'un moteur de recherche modulaire a été souligné. Ce lui assure son évolution, lui permet d'évoluer dynamiquement. Cela permet également d'interfacer beaucoup d'outils au travers d'API.&lt;/p&gt;

&lt;h2&gt;BOINC et le calcul distribué&lt;/h2&gt;

&lt;p&gt;Une des faiblesse de Valiz sera sa faible infrastructure hardware comme nos moyens seront forcément limités. Une idée avancée lors de cette discussion était de sous-traiter des calculs à une plate-forme de calcul distribué via &lt;a href=&quot;http://boinc.berkeley.edu/&quot; hreflang=&quot;fr&quot;&gt;BOINC&lt;/a&gt; par exemple. Une partie du travail pourrait ainsi être traité en-dehors des serveurs de Valiz. Il ne s'agirait évidemment pas de calcul en temps réel mais plutôt de traitements de l'index, d'analyse de contenu, etc...&lt;br /&gt;&lt;/p&gt;

&lt;h2&gt;Faire participer les universités&lt;/h2&gt;

&lt;p&gt;Une autre idée qui a été proposé est de soumettre Valiz, ou du moins certains modules aux universités qui ont les moyens de le faire avancer et de mettre des serveurs à disposition. C'est probablement le chemin le plus plausible pour que Valiz devienne réalité.&lt;/p&gt;

&lt;h2&gt;Le site de Valiz&lt;/h2&gt;

&lt;h3&gt;Le blog&lt;/h3&gt;

&lt;p&gt;Plusieurs personnes ont critiqué le blog comme support de discussion pour les débats. Ce n'est pas un support adapté, il devrait plutôt être utilisé pour faire des annonces sur l'avancement du projet. Ce n'est pas faux.&lt;/p&gt;

&lt;h3&gt;La page d'accueil&lt;/h3&gt;

&lt;p&gt;Cette page n'est pas suffisamment compréhensible, elle prête à confusion. Surtout la partie en anglais qui est du pure massacre (issu de Google Translate), il faudrait au minimum que je la réécrive. Je pense plutôt la remplacer par une explication beaucoup plus concise et mettrait en avant le blog et le wiki.&lt;/p&gt;

&lt;h3&gt;Le wiki&lt;/h3&gt;

&lt;p&gt;Beaucoup étaient de l'avis que le wiki était la forme la plus adaptée au projet. Il y en avait déjà un en place, un Dokuwiki. Mais il semblerait qu'il y ait besoin de quelque chose de plus costaud pour notamment y intégrer les discussions. C'est pourquoi je vais remplacer le Dokuwiki par un Mediawiki très prochainement.&lt;/p&gt;

&lt;h2&gt;Structure et cadre du projet&lt;/h2&gt;

&lt;p&gt;J'ai profité de la discussion pour situer le cadre de Valiz. Il s'agit d'un projet bénévole entretenu par des passionnés. Valiz sera un des projets de l'&lt;a href=&quot;http://www.texuma.org&quot; hreflang=&quot;fr&quot;&gt;association Texuma&lt;/a&gt;, une association à but non-lucratif dont l'objectif et de faciliter le développement de projets software ou touchant à internet.&lt;/p&gt;

&lt;h2&gt;Le budget et la publicité&lt;/h2&gt;

&lt;p&gt;Le thème de la publicité a été abordé également. Allons-nous intégrer de la publicité dans les résultats des recherches&amp;nbsp;? Non évidemment. Pourquoi ?&lt;br /&gt;
Proposer de la publicité sur une page souhaitant présenter du contenu accessible dans ses résultats implique que la publicité aboutisse également vers des sites accessibles. Et si le site visé par la publicité était accessible, il figurerait naturellement en bonne place dans les résultats et n'aurait donc pas à payer. Par ailleurs le but de Valiz n'est pas lucratif.&lt;br /&gt;
Évidemment ça ne rend pas les choses simples pour autant, un moteur de recherche a besoin d'importantes ressources hardware (serveurs, baies, bande passante, switchs, routeurs ,spares, etc...) ce qui est extrêmement onéreux. Évidemment une partie du budget pourrait être constituée de dons, mais il faudrait avoir une popularité similaire à Wikipedia pour que ce soit significatif.&lt;br /&gt;
Même si cela reste un point capital, je préfère ne pas trop m'y attarder tant que nous n'avons pas un cahier des charges concret et réaliste.&lt;/p&gt;

&lt;h2&gt;Et maintenant&amp;nbsp;?&lt;/h2&gt;

&lt;p&gt;Vous êtes plus que jamais invité à continuer de débattre. Valiz n'est pas mort et cherche à avoir un maximum de contributeurs pour discuter du cahier des charges. Il n'y a pas besoin de compétences particulières, être un utilisateur d'un moteur de recherche suffit amplement pour dire ce qui nous manque, comment on veut obtenir l'information, ce qui ne va pas avec les résultats, etc... Pour cela je vais mettre en place le wiki sous quelques jours.&lt;br /&gt;
Comme l'expérience était concluante, il n'est pas impossible que de nouvelles discussions de ce type aient lieu, que ce soit sur le salon d'exalead ou ailleurs. L'idéal à moyen terme serait de réunir les personnes intéressées sur un salon dédié permanent.
&lt;a href=&quot;http://chat.jabberfr.org/logs/exalead@chat.jabberfr.org/2008-10-18.html&quot; hreflang=&quot;fr&quot;&gt;Le log complet de la discussion&lt;/a&gt;&lt;/p&gt;</description>
    
    
    
          <comments>http://www.valiz.org/blog/index.php/post/2008/10/19/Compte-rendu-de-la-discussion-jabber-du-18-octobre-2008#comment-form</comments>
      <wfw:comment>http://www.valiz.org/blog/index.php/post/2008/10/19/Compte-rendu-de-la-discussion-jabber-du-18-octobre-2008#comment-form</wfw:comment>
      <wfw:commentRss>http://www.valiz.org/blog/index.php/feed/rss2/comments/18</wfw:commentRss>
      </item>
    
  <item>
    <title>État du projet</title>
    <link>http://www.valiz.org/blog/index.php/post/2007/05/27/Etat-du-projet</link>
    <guid isPermaLink="false">urn:md5:1678bc70a62a4012899958d929961d45</guid>
    <pubDate>Sun, 27 May 2007 14:22:00 +0200</pubDate>
    <dc:creator>Reivilo</dc:creator>
        <category>Avancement</category>
        <category>contribuer</category><category>valiz</category>    
    <description>    &lt;p&gt;Bonjour à tous,&lt;br /&gt;
&lt;br /&gt;&lt;/p&gt;

&lt;h2&gt;Petit rappel&lt;/h2&gt;

&lt;p&gt;Cela fait déjà 140 jours qu'il n'y a plus eu de mise à jour sur ce blog. Il est temps de remettre le compteur à zéro.&lt;br /&gt;
Je rappelle le but de ce blog&amp;nbsp;: débattre sur divers sujets ayant un lien avec la recherche accessible dans le but d'établir le cahier des charges d'un moteur de recherche simple, puissant, libre et gratuit. J'ai eu bon nombre de feedbacks (très peu par commentaire, c'est dommage) et le projet intéresse plusieurs personnes. Cependant pour obtenir une bonne base, il faut davantage d'intervenants dans les débats sur ce blog.&lt;br /&gt;
Je précise que tous les billets de ce blog peuvent recevoir des commentaires en tout temps, vous pouvez relancer un débat quand vous voulez.&lt;br /&gt;
&lt;br /&gt;&lt;/p&gt;

&lt;h2&gt;Petite synthèse&lt;/h2&gt;

&lt;p&gt;Valiz est un projet gigantesque qui est très intéressant sous beaucoup d'aspects (que ce soit éthique, technique ou simplement en tant que défi). Cependant il y a des côtés qui risquent de pénaliser le projet&amp;nbsp;:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Les acteurs du projet&amp;nbsp;: L'idéal ce serait de former une bonne communauté remplie de talents motivés pour la bonne cause. Mais ce n'est pas évident à trouver.&lt;/li&gt;
&lt;li&gt;Le financement&amp;nbsp;: Tout le monde aimerait un moteur gratuit, sans publicité, etc... Mais l'infrastructure (on ne compte pas la main d'oeuvre qui est censée être bénévole) est extrêmement onéreuse pour un projet de cette ampleur. Si on peut se débrouiller pour monter de quoi tester l'algorithme à petite échelle, c'est une autre paire de manche pour permettre l'accès universel. Je ne suis pas persuadé qu'un tel projet puisse tourner exclusivement avec des dons.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;br /&gt;&lt;/p&gt;

&lt;h2&gt;Conclusion&lt;/h2&gt;

&lt;p&gt;Je suis toujours motivé si vous l'êtes aussi. Je ne peux me lancer seul dans un tel projet (j'ai des compétences dans pas mal de domaines, mais je ne peux pas tout faire ni être efficace dans tous les domaines et il est dur de réunir toutes les bonnes idées avec une seule personne).&lt;br /&gt;
Donc, je vous invite une nouvelle fois à&amp;nbsp;:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Intervenir régulièrement sur ce blog&lt;/li&gt;
&lt;li&gt;Faire connaitre cette initiative autour de vous, à en parler sur vos blogs, forums,...&lt;/li&gt;
&lt;li&gt;Me contacter à soutien@valiz.org pour toutes propositions, message de soutien, si vous seriez intéresser à faire un don par la suite, si vous souhaitez être averti de tout évènement majeur, etc...&lt;br /&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;De mon côté, je disposerai de beaucoup de temps dès juillet. Donc si vous êtes motivé, nous pouvons faire avancer ensemble ce projet dès cet été.&lt;/p&gt;

&lt;pre&gt;&lt;/pre&gt;

&lt;p&gt;&lt;a href=&quot;http://forum.ubuntu-fr.org/viewtopic.php?id=121547&quot; hreflang=&quot;fr&quot;&gt;Google libre sur les forums d'Ubuntu-fr&lt;/a&gt;&lt;/p&gt;</description>
    
    
    
          <comments>http://www.valiz.org/blog/index.php/post/2007/05/27/Etat-du-projet#comment-form</comments>
      <wfw:comment>http://www.valiz.org/blog/index.php/post/2007/05/27/Etat-du-projet#comment-form</wfw:comment>
      <wfw:commentRss>http://www.valiz.org/blog/index.php/feed/rss2/comments/16</wfw:commentRss>
      </item>
    
  <item>
    <title>Réflexion sur une architecture externe</title>
    <link>http://www.valiz.org/blog/index.php/post/2007/01/29/Reflexion-sur-une-architecture-externe</link>
    <guid isPermaLink="false">urn:md5:159bd789e7da52aac9013872ea48c40e</guid>
    <pubDate>Mon, 29 Jan 2007 20:12:00 +0100</pubDate>
    <dc:creator>Reivilo</dc:creator>
        <category>Infrastructure</category>
        <category>bot</category><category>contribuer</category><category>infrastructure</category><category>performance</category><category>serveur</category>    
    <description>    &lt;h2&gt;Le fait&lt;/h2&gt;

&lt;p&gt;Je l'ai déjà dit assez souvent, mais ça ne fait pas de mal de le répéter&amp;nbsp;: un moteur de recherche, ça prend des ressources, beaucoup de ressources (humaines et systèmes). Des serveurs puissants sont requis, et il en faut en nombre pour garantir un minimum de réactivité pour l'indexation et la prise en compte de modification.&lt;/p&gt;

&lt;h2&gt;Contribuer efficacement&lt;/h2&gt;

&lt;p&gt;Valiz visant le 100% open-source (donc gratuit, libre, aucun profit financier, etc..., le financement de ces serveurs sera un beau problème, j'espère que les dons en couvriront une partie et peut-être même qu'un ou plusieurs partenaires seront intéressés à soutenir le projet (financièrement ou matériellement).&lt;br /&gt;
Pour l'infrastructure, j'en avait déjà vaguement parlé dans un précédent article, mais j'ai eu récemment une autre idée&amp;nbsp;: &lt;strong&gt;créer une architecture atome&lt;/strong&gt;
Pourquoi atome&amp;nbsp;? Parce que ça y ressemble&amp;nbsp;:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Un noyau avec les bases de données et  serveurs pour les résultats à la volée. C'est toujours le noyau qui affiche le résultat.&lt;/li&gt;
&lt;li&gt;Des électrons qui gravitent autour du noyau&amp;nbsp;:  des serveurs (ou plus précisément des ressources serveurs) mises à disposition par des particuliers, entreprise ou autre association qui désire soutenir Valiz et qui auraient un ou plusieurs serveurs qui tournent à vide ou presque.&lt;/li&gt;
&lt;/ul&gt;
&lt;h2&gt;Serveur électron&lt;/h2&gt;

&lt;p&gt;&lt;em&gt;(Le nom sert juste de lien avec l'atom, c'est juste un modèle, un nom plus convenable sera probablement trouvé).&lt;/em&gt;&lt;br /&gt;
Ces serveurs font le lien entre le web et le noyau, ils peuvent servir de ValizBot (en mode indexation, mise à jour,... ou encore 100% réservé à son site) ou de générateur de cache (mise à jour des requêtes populaires, pré-formatage,...),. Cela permet non seulement d'alléger la charge du noyau, mais également d'augmenter de manière proportionnel à sa popularité sa réactivité.&lt;/p&gt;

&lt;h2&gt;Problème de sécurité&lt;/h2&gt;

&lt;p&gt;Valiz est open-source et facilement modifiable, mais il ne faut en aucun cas que les paramètres d'indexation et autres critères puissent être modifiés extérieurement. Un serveur satellite signifie un accès au noyau ainsi que des accès sql (très limités), pour éviter des problèmes, il sera impératif de valider les accès un par un avec vérification des intentions de la personne souhaitant contribuer.&lt;br /&gt;
Ensuite vient le problème de l'environnement installé sur le serveur permettant d'exécuter ValizBot ou autre générateur de cache. Il ne faut surtout pas qu'il soit en langage interprété (beaucoup trop facilement modifiable par le propriétaire pour avantager ses sites ou injecter n'importe quoi dans les bases de données. Je pense qu'un langage compilé comme le C++ a davantage sa place. Ensuite il faut simplifier la mise à jour. Pour ça, je pense à une gestion par paquet binaire (dpkg et rpm) et pour ce qui est de l'auhentification, l'astuce reste à trouver (probablement sous la forme d'un clef).&lt;/p&gt;

&lt;h2&gt;Conclusion&lt;/h2&gt;

&lt;p&gt;Je pense que ce concept pourrait donner pas mal de potentiel à Valiz, néanmoins sa conception devra faire face à énormément de défis. Qu'en pensez-vous&amp;nbsp;?&lt;/p&gt;</description>
    
    
    
          <comments>http://www.valiz.org/blog/index.php/post/2007/01/29/Reflexion-sur-une-architecture-externe#comment-form</comments>
      <wfw:comment>http://www.valiz.org/blog/index.php/post/2007/01/29/Reflexion-sur-une-architecture-externe#comment-form</wfw:comment>
      <wfw:commentRss>http://www.valiz.org/blog/index.php/feed/rss2/comments/14</wfw:commentRss>
      </item>
    
  <item>
    <title>Lancement du projet Valiz</title>
    <link>http://www.valiz.org/blog/index.php/post/2007/01/06/Lancement-du-projet-Valiz</link>
    <guid isPermaLink="false">urn:md5:183aab11bf65d0fdbb344c9d3e9b3f8b</guid>
    <pubDate>Sat, 06 Jan 2007 15:46:00 +0000</pubDate>
    <dc:creator>Reivilo</dc:creator>
        <category>Généralités</category>
        <category>accessibilité</category><category>algorithme</category><category>contribuer</category><category>résultats</category><category>valiz</category><category>W3C</category>    
    <description>    &lt;h3&gt;Bonjour à tous et merci pour votre curiosité,&lt;/h3&gt;

&lt;p&gt;&lt;br /&gt;
Si vous êtes ici, c'est que vous vous intéressez au projet Valiz, je vais expliquer dans ce billet pourquoi j'ai lancé l'idée, pourquoi j'espère que Valiz voie le jour, comment sera organisé ce blog et ce que j'espère obtenir.&lt;br /&gt;
Vous connaissez tous le principe des moteurs de recherche&amp;nbsp;: trouver rapidement la réponse à une question, des informations sur un sujet ou des sites de qualités traitant de quelque chose en particulier. Pour cela diverses sociétés proposent leurs moteurs de recherche, financés par la publicité intégrée aux résultats et l'une d'entre elle a quasiment le monopole.&lt;br /&gt;
Le problème, c'est qu'ils sont dépassés par l'ingéniosité des spammeurs car ils acceptent presque tout dans leurs index et leur algorithme accorde beaucoup d'importance aux critères externes des sites (liens pointant vers le site notamment).&lt;br /&gt;
Les objectif de Valiz sont les suivants&amp;nbsp;:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Développer un algorithme qui se base uniquement sur la pertinence du contenu en oubliant tout repaire externe&lt;/li&gt;
&lt;li&gt;Ne répertorier que les pages accessibles en se basant &lt;strong&gt;&lt;a href=&quot;http://www.valiz.org/blog/index.php/post/2007/01/06/Criteres-daccessibilite-et-conformite-W3C&quot; hreflang=&quot;fr&quot;&gt;dans un premier temps&lt;/a&gt;&lt;/strong&gt; sur la validation W3C.&lt;/li&gt;
&lt;li&gt;Faire un moteur 100% open-source&amp;nbsp;: tout le code sera distribué et tout le monde peut y contribuer, un peu comme le projet Nutch&lt;/li&gt;
&lt;li&gt;À l'inverse de Nutch, le moteur sera un service public avec de nombreuses interface permettant d'exploiter ses résultats&lt;/li&gt;
&lt;li&gt;Rester totalement libre et gratuit&amp;nbsp;: aucune publicité commerciale, association à but non-lucratif&lt;/li&gt;
&lt;li&gt;Suivre un développement totalement modulaire pour pouvoir facilement adapter les algorithme ou être intégré dans divers projets&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Le but de Valiz n'est pas de concurrencer les moteurs actuels mais de proposer une alternative libre au monopole commercial actuel des moteurs de recherche et surtout des résultats accessibles à tous.&lt;br /&gt;
&lt;br /&gt;&lt;/p&gt;

&lt;h2&gt;Si vous souhaitez soutenir Valiz, vous pouvez selon votre temps, compétence et motivation&amp;nbsp;:&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;Suivre le développement en alimentant et argumentant votre vision lors des billets sur ce blog ou sur les forums&lt;/li&gt;
&lt;li&gt;Nous aider en devenant rédacteur/traducteur (si vous avez une orthographe et grammaire correcte et que vous maitrisez  au moins le français, le projet aura une documentation complète en français et anglais dans un premier temps puis ouvert à toutes les langues, donc si vous êtes bilingue, n'hésitez pas...)&lt;/li&gt;
&lt;li&gt;Nous aider au développement, si vous avez des connaissances en (pas besoin d'avoir tout à la fois...)&amp;nbsp;: xHTML, CSS, PHP 5/6, PostgreSQL, cluster, Java, Python, Bash, SOAP, xml, accessibilité,...&lt;/li&gt;
&lt;li&gt;Nous soutenir financièrement, actuellement l'association n'est pas déclarée mais vous pouvez faire une promesse de don à don(@)valiz.org ou si vous êtes intéressé à fournir des serveurs, bande passante, baie,... on en aura grand besoin.&lt;/li&gt;
&lt;li&gt;Nous soutenir moralement&amp;nbsp;: un commentaire, un mail ça fait toujours énormément plaisir.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;br /&gt;
Ce blog contiendra des billets sur l'avancée du projet, sur les débats (choix), etc...&lt;/p&gt;</description>
    
    
    
          <comments>http://www.valiz.org/blog/index.php/post/2007/01/06/Lancement-du-projet-Valiz#comment-form</comments>
      <wfw:comment>http://www.valiz.org/blog/index.php/post/2007/01/06/Lancement-du-projet-Valiz#comment-form</wfw:comment>
      <wfw:commentRss>http://www.valiz.org/blog/index.php/feed/rss2/comments/1</wfw:commentRss>
      </item>
    
</channel>
</rss>