<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet title="XSL formatting" type="text/xsl" href="http://www.valiz.org/blog/index.php/feed/rss2/xslt" ?><rss version="2.0"
  xmlns:dc="http://purl.org/dc/elements/1.1/"
  xmlns:wfw="http://wellformedweb.org/CommentAPI/"
  xmlns:content="http://purl.org/rss/1.0/modules/content/">
<channel>
  <title>Valiz : Moteur de recherche open-source - lastmod</title>
  <link>http://www.valiz.org/blog/index.php/</link>
  <description>Blog francophone du développement du projet de moteur libre Valiz.</description>
  <language>fr</language>
  <pubDate>Tue, 16 Dec 2008 17:15:57 +0100</pubDate>
  <copyright>Le contenu de ce blog peut être copié à condition de citer la source avec un lien en dur.</copyright>
  <docs>http://blogs.law.harvard.edu/tech/rss</docs>
  <generator>Dotclear</generator>
  
    
  <item>
    <title>Rafraichissement des résultats</title>
    <link>http://www.valiz.org/blog/index.php/post/2007/01/08/Rafraichissement-des-resultats</link>
    <guid isPermaLink="false">urn:md5:ab60e5c2e6dd13d5a2e3fce61510c350</guid>
    <pubDate>Mon, 08 Jan 2007 20:52:00 +0100</pubDate>
    <dc:creator>Reivilo</dc:creator>
        <category>Débats</category>
        <category>cache</category><category>calcul</category><category>flag</category><category>index</category><category>lastmod</category><category>requête</category>    
    <description>    &lt;p&gt;Calculer les résultats pour une requête requiert beaucoup de ressources, il serait suicidaire d'appliquer un calcul en temps réel pour chaque requête. Même les plus grands moteurs ne font pas du calcul instantané (et si plus est la base est de 8 milliards de pages...).&lt;br /&gt;
Comment économiser les ressources tout en restant le plus possible à jour&amp;nbsp;?&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Diminuer l'étendue de la recherche en séparant par thématique et autres flags attribués lors de l'indexation&lt;/li&gt;
&lt;li&gt;Effectuer des calculs de pertinence permanents en arrière-plan&lt;/li&gt;
&lt;li&gt;Générer de manière autonome les requêtes courantes&lt;/li&gt;
&lt;li&gt;Mettre en cache les requêtes effectuées&lt;/li&gt;
&lt;li&gt;Calcul instantané basé sur les requêtes proches en cache&amp;nbsp;?&lt;/li&gt;
&lt;li&gt;etc...&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Mais à quelle fréquence mettre à jour le cache&amp;nbsp;? On pourrait établir des niveaux de popularités/fréquence de nouveautés et ainsi faire des mises à jour toutes les 24/48h voir une fois par semaine. Mais le plus important serait probablement un cache intelligent&amp;nbsp;:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Mise à jour lorsque de nouveaux résultats détectés comme pertinents sont ajoutés ou mis à jour dans l'index&lt;/li&gt;
&lt;li&gt;Requêtes &lt;em&gt;chaudes&lt;/em&gt; (actualité, débats, évènement) où les informations évoluent très rapidement&amp;nbsp;: donc mise à jour très fréquentes&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Un autre domaine à examiner serait la catégorie actualité des résultats, je pense que le plus pertinent serait de se baser sur les flux rss (pour avoir le plus récent sans avoir à aller le chercher avec valizbot) et cette sous-catégorie serait gérée indépendamment du cache ou alors bénéficierait d'un cache séparé (reconstruit selon le même principe).&lt;br /&gt;
Dans la même lancée, nous pourrions nous interroger sur la fréquence de mise à jour par valizbot, la solution la plus simple de se baser sur le couple sitemaps/lastmod, mais ce concept est encore très peu utilisé et souvent de manière incorrecte. Mais ceci fera l'objet d'un autre article...&lt;/p&gt;</description>
    
    
    
          <comments>http://www.valiz.org/blog/index.php/post/2007/01/08/Rafraichissement-des-resultats#comment-form</comments>
      <wfw:comment>http://www.valiz.org/blog/index.php/post/2007/01/08/Rafraichissement-des-resultats#comment-form</wfw:comment>
      <wfw:commentRss>http://www.valiz.org/blog/index.php/feed/rss2/comments/5</wfw:commentRss>
      </item>
    
</channel>
</rss>