elastic · hendrikmuhs · Mar 6, 2020 · Mar 10, 2020 · Mar 10, 2020 · nik9000
diff --git a/server/src/main/java/org/elasticsearch/index/fielddata/FieldData.java b/server/src/main/java/org/elasticsearch/index/fielddata/FieldData.java
@@ -367,6 +367,11 @@ public BytesRef nextValue() throws IOException {
                 return values.lookupOrd(values.nextOrd());
             }
 
+            @Override
+            public BytesRef normalizeValue(BytesRef value) {
+                return value;
+            }
+
         };
     }
 
@@ -412,6 +417,11 @@ public boolean advanceExact(int docID) throws IOException {
                 return true;
             }
 
+            @Override
+            public BytesRef normalizeValue(BytesRef value) {
+                return value;
+            }
+
         };
     }
 

diff --git a/server/src/main/java/org/elasticsearch/index/fielddata/SingletonSortedBinaryDocValues.java b/server/src/main/java/org/elasticsearch/index/fielddata/SingletonSortedBinaryDocValues.java
@@ -51,4 +51,9 @@ public BinaryDocValues getBinaryDocValues() {
         return in;
     }
 
+    @Override
+    public BytesRef normalizeValue(BytesRef value) {
+        return value;
+    }
+
 }
diff --git a/server/src/main/java/org/elasticsearch/index/fielddata/SortedBinaryDocValues.java b/server/src/main/java/org/elasticsearch/index/fielddata/SortedBinaryDocValues.java
@@ -52,4 +52,10 @@ public abstract class SortedBinaryDocValues {
      */
     public abstract BytesRef nextValue() throws IOException;
 
+    /**
+     * Applies normalization to the value for example a value script if needed.
+     * @return {@link BytesRef} of the normalized value which can be value if no
+     * normalization is required.
+     */
+    public abstract BytesRef normalizeValue(BytesRef value);
 }
diff --git a/...r/src/main/java/org/elasticsearch/index/fielddata/plain/BytesBinaryDVAtomicFieldData.java b/...r/src/main/java/org/elasticsearch/index/fielddata/plain/BytesBinaryDVAtomicFieldData.java
@@ -85,6 +85,11 @@ public BytesRef nextValue() throws IOException {
                 return scratch;
             }
 
+            @Override
+            public BytesRef normalizeValue(BytesRef value) {
+                return value;
+            }
+
         };
     }
 

diff --git a/server/src/main/java/org/elasticsearch/index/mapper/IdFieldMapper.java b/server/src/main/java/org/elasticsearch/index/mapper/IdFieldMapper.java
@@ -48,10 +48,10 @@
 import org.elasticsearch.indices.breaker.CircuitBreakerService;
 import org.elasticsearch.search.DocValueFormat;
 import org.elasticsearch.search.MultiValueMode;
-import org.elasticsearch.search.sort.BucketedSort;
-import org.elasticsearch.search.sort.SortOrder;
 import org.elasticsearch.search.aggregations.support.CoreValuesSourceType;
 import org.elasticsearch.search.aggregations.support.ValuesSourceType;
+import org.elasticsearch.search.sort.BucketedSort;
+import org.elasticsearch.search.sort.SortOrder;
 
 import java.io.IOException;
 import java.util.Arrays;
@@ -275,6 +275,11 @@ public int docValueCount() {
                     public boolean advanceExact(int doc) throws IOException {
                         return inValues.advanceExact(doc);
                     }
+
+                    @Override
+                    public BytesRef normalizeValue(BytesRef value) {
+                        return value;
+                    }
                 };
             }
         };

diff --git a/.../main/java/org/elasticsearch/search/aggregations/bucket/composite/BinaryValuesSource.java b/.../main/java/org/elasticsearch/search/aggregations/bucket/composite/BinaryValuesSource.java
@@ -173,11 +173,13 @@ public void collect(int doc, long bucket) throws IOException {
     }
 
     @Override
-    LeafBucketCollector getLeafCollector(Comparable value, LeafReaderContext context, LeafBucketCollector next) {
+    LeafBucketCollector getLeafCollector(Comparable value, LeafReaderContext context, LeafBucketCollector next) throws IOException {
         if (value.getClass() != BytesRef.class) {
             throw new IllegalArgumentException("Expected BytesRef, got " + value.getClass());
         }
-        currentValue = (BytesRef) value;
+        final SortedBinaryDocValues dvs = docValuesFunc.apply(context);
+        currentValue = dvs.normalizeValue((BytesRef) value);
+
         return new LeafBucketCollector() {
             @Override
             public void collect(int doc, long bucket) throws IOException {

diff --git a/server/src/main/java/org/elasticsearch/search/aggregations/support/MissingValues.java b/server/src/main/java/org/elasticsearch/search/aggregations/support/MissingValues.java
@@ -91,6 +91,11 @@ public BytesRef nextValue() throws IOException {
             public String toString() {
                 return "anon SortedBinaryDocValues of [" + super.toString() + "]";
             }
+
+            @Override
+            public BytesRef normalizeValue(BytesRef value) {
+                return value;
+            }
         };
     }
 

diff --git a/server/src/main/java/org/elasticsearch/search/aggregations/support/ValuesSource.java b/server/src/main/java/org/elasticsearch/search/aggregations/support/ValuesSource.java
@@ -282,6 +282,13 @@ public void setScorer(Scorable scorer) {
                     script.setScorer(scorer);
                 }
 
+                @Override
+                public BytesRef normalizeValue(BytesRef value) {
+                    script.setNextAggregationValue(value.utf8ToString());
+                    Object run = script.execute();
+                    return new BytesRef(run.toString());
+                }
+
                 @Override
                 public boolean advanceExact(int doc) throws IOException {
                     if (bytesValues.advanceExact(doc)) {

diff --git a/...src/main/java/org/elasticsearch/search/aggregations/support/values/ScriptBytesValues.java b/...src/main/java/org/elasticsearch/search/aggregations/support/values/ScriptBytesValues.java
@@ -19,6 +19,7 @@
 package org.elasticsearch.search.aggregations.support.values;
 
 import org.apache.lucene.search.Scorable;
+import org.apache.lucene.util.BytesRef;
 import org.elasticsearch.common.lucene.ScorerAware;
 import org.elasticsearch.common.util.CollectionUtils;
 import org.elasticsearch.index.fielddata.SortedBinaryDocValues;
@@ -88,4 +89,11 @@ public boolean advanceExact(int doc) throws IOException {
     public void setScorer(Scorable scorer) {
         script.setScorer(scorer);
     }
+
+    @Override
+    public BytesRef normalizeValue(BytesRef value) {
+        script.setNextAggregationValue(value.utf8ToString());
+        Object run = script.execute();
+        return new BytesRef(run.toString());
+    }
 }
diff --git a/server/src/test/java/org/elasticsearch/index/query/functionscore/FunctionScoreTests.java b/server/src/test/java/org/elasticsearch/index/query/functionscore/FunctionScoreTests.java
@@ -119,6 +119,11 @@ public int docValueCount() {
                         public BytesRef nextValue() {
                             return new BytesRef("0");
                         }
+
+                        @Override
+                        public BytesRef normalizeValue(BytesRef value) {
+                            return value;
+                        }
                     };
                 }
 

diff --git a/server/src/test/java/org/elasticsearch/search/MultiValueModeTests.java b/server/src/test/java/org/elasticsearch/search/MultiValueModeTests.java
@@ -524,6 +524,11 @@ public boolean advanceExact(int doc) {
             public int docValueCount() {
                 return array[doc].length;
             }
+
+            @Override
+            public BytesRef normalizeValue(BytesRef value) {
+                return value;
+            }
         };
         verifySortedBinary(multiValues, numDocs);
         final FixedBitSet rootDocs = randomRootDocs(numDocs);

diff --git a/...t/java/org/elasticsearch/search/aggregations/bucket/range/BinaryRangeAggregatorTests.java b/...t/java/org/elasticsearch/search/aggregations/bucket/range/BinaryRangeAggregatorTests.java
@@ -18,10 +18,7 @@
  */
 package org.elasticsearch.search.aggregations.bucket.range;
 
-import java.io.IOException;
-import java.util.Arrays;
-import java.util.HashSet;
-import java.util.Set;
+import com.carrotsearch.hppc.LongHashSet;
 
 import org.apache.lucene.util.BytesRef;
 import org.apache.lucene.util.TestUtil;
@@ -32,7 +29,10 @@
 import org.elasticsearch.search.aggregations.bucket.range.BinaryRangeAggregator.SortedSetRangeLeafCollector;
 import org.elasticsearch.test.ESTestCase;
 
-import com.carrotsearch.hppc.LongHashSet;
+import java.io.IOException;
+import java.util.Arrays;
+import java.util.HashSet;
+import java.util.Set;
 
 public class BinaryRangeAggregatorTests extends ESTestCase {
 
@@ -169,6 +169,11 @@ public BytesRef nextValue() {
             return terms[(int) ords[i++]];
         }
 
+        @Override
+        public BytesRef normalizeValue(BytesRef value) {
+            return value;
+        }
+
     }
 
     private void doTestSortedBinaryRangeLeafCollector(int maxNumValuesPerDoc) throws Exception {

diff --git a/server/src/test/java/org/elasticsearch/search/aggregations/support/MissingValuesTests.java b/server/src/test/java/org/elasticsearch/search/aggregations/support/MissingValuesTests.java
@@ -73,6 +73,11 @@ public boolean advanceExact(int docId) {
             public int docValueCount() {
                 return values[doc].length;
             }
+
+            @Override
+            public BytesRef normalizeValue(BytesRef value) {
+                return value;
+            }
         };
         final BytesRef missing = new BytesRef(RandomStrings.randomAsciiOfLength(random(), 2));
         SortedBinaryDocValues withMissingReplaced = MissingValues.replaceMissing(asBinaryValues, missing);