<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed><type>rich</type><version>1.0</version><provider_name>phorkie</provider_name><provider_url>https://p.cweiske.de/</provider_url><title>Elasticsearch: Suche: "chairs" findet Kategorien, "chair" nicht</title><author_name>Christian Weiske</author_name><cache_age>86400</cache_age><width>900</width><height>900</height><html>&lt;!-- embedding all files of https://p.cweiske.de/511 --&gt;
&lt;link rel="stylesheet" href="https://p.cweiske.de/css/embed.css"/&gt;
&lt;div class="phork" id="511"&gt;
    &lt;div class="phork-file"&gt;
 &lt;div class="phork-content"&gt;
  
&lt;div class="document"&gt;


&lt;div class="section" id="problem"&gt;
&lt;h1&gt;Problem&lt;/h1&gt;
&lt;ul class="simple"&gt;
&lt;li&gt;Kategorien werden gefunden: &lt;a class="reference external" href="http://localhost:5609/en/search?query=chairs"&gt;http://localhost:5609/en/search?query=chairs&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Keine Kategorien: &lt;a class="reference external" href="http://localhost:5609/en/search?query=chair"&gt;http://localhost:5609/en/search?query=chair&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Eigentlich sollte das Stemming das doch erledigen, oder?&lt;/p&gt;
&lt;/div&gt;
&lt;div class="section" id="ursache"&gt;
&lt;h1&gt;Ursache&lt;/h1&gt;
&lt;p&gt;Wir suchen mit &lt;tt class="docutils literal"&gt;simple_query_string&lt;/tt&gt; auf dem &lt;tt class="docutils literal"&gt;_all&lt;/tt&gt;-Feld. &lt;tt class="docutils literal"&gt;_all&lt;/tt&gt; wird standardmäßig mit dem .. StandardAnalyzer analysiert, d.h. ohne Stemming. Deshalb wird da nichts gefunden.&lt;/p&gt;
&lt;p&gt;Wenn wir direkt auf den Feldern suchen würden, würde es gehen. Das ist über mehrere Indexe hinweg aber schlecht.&lt;/p&gt;
&lt;/div&gt;
&lt;div class="section" id="losung"&gt;
&lt;h1&gt;Lösung&lt;/h1&gt;
&lt;p&gt;Wir sammeln deutsche Daten in einem &lt;tt class="docutils literal"&gt;all.de&lt;/tt&gt; und englische Daten in einem &lt;tt class="docutils literal"&gt;all.en&lt;/tt&gt;. Diese belegen wir mit dem korrekten Sprachanalyzer und durchsuchen beide.
&lt;tt class="docutils literal"&gt;_all&lt;/tt&gt; deaktivieren wir einfach, um darauf hinzuweisen, dass wir das anders machen (gibt nen Fehler, wenn man beim query keinen Feldnamen angibt).&lt;/p&gt;
&lt;/div&gt;
&lt;/div&gt;

 &lt;/div&gt;
 &lt;div class="phork-meta"&gt;
  &lt;a href="https://p.cweiske.de/511/rev-raw/b5e4ea27332c09f7cdb6d93132913cc0387fbdd8/README.rst" style="float: right"&gt;view raw source&lt;/a&gt;
  &lt;a href="https://p.cweiske.de/511#README.rst"&gt;README.rst&lt;/a&gt;
 &lt;/div&gt;
&lt;/div&gt;
&lt;/div&gt;
</html></oembed>
