opensearch-project · sarthakaggarwal97 · Jan 17, 2024 · Jan 23, 2024 · reta · Jan 18, 2024
@@ -47,11 +47,11 @@ public CustomCodecService(MapperService mapperService, IndexSettings indexSettin
         int compressionLevel = indexSettings.getValue(INDEX_CODEC_COMPRESSION_LEVEL_SETTING);
         final MapBuilder<String, Codec> codecs = MapBuilder.<String, Codec>newMapBuilder();
         if (mapperService == null) {
-            codecs.put(ZSTD_CODEC, new ZstdCodec(compressionLevel));
-            codecs.put(ZSTD_NO_DICT_CODEC, new ZstdNoDictCodec(compressionLevel));
+            codecs.put(ZSTD_CODEC, new Zstd99Codec(compressionLevel));
+            codecs.put(ZSTD_NO_DICT_CODEC, new ZstdNoDict99Codec(compressionLevel));
         } else {
-            codecs.put(ZSTD_CODEC, new ZstdCodec(mapperService, logger, compressionLevel));
-            codecs.put(ZSTD_NO_DICT_CODEC, new ZstdNoDictCodec(mapperService, logger, compressionLevel));
+            codecs.put(ZSTD_CODEC, new Zstd99Codec(mapperService, logger, compressionLevel));
+            codecs.put(ZSTD_NO_DICT_CODEC, new ZstdNoDict99Codec(mapperService, logger, compressionLevel));
         }
         this.codecs = codecs.immutableMap();
     }

@@ -11,21 +11,21 @@
 import org.apache.logging.log4j.Logger;
 import org.apache.lucene.codecs.FilterCodec;
 import org.apache.lucene.codecs.StoredFieldsFormat;
-import org.apache.lucene.codecs.lucene95.Lucene95Codec;
+import org.apache.lucene.codecs.lucene99.Lucene99Codec;
 import org.opensearch.index.codec.PerFieldMappingPostingFormatCodec;
 import org.opensearch.index.mapper.MapperService;
 
-import java.util.Collections;
 import java.util.Set;
 
 /**
  *
  * Extends {@link FilterCodec} to reuse the functionality of Lucene Codec.
  * Supports two modes zstd and zstd_no_dict.
+ * Uses Lucene99 as the delegate codec
  *
  * @opensearch.internal
  */
-public abstract class Lucene95CustomCodec extends FilterCodec {
+public abstract class Lucene99CustomCodec extends FilterCodec {
 
     /** Default compression level used for compression */
     public static final int DEFAULT_COMPRESSION_LEVEL = 3;
@@ -35,17 +35,11 @@ public enum Mode {
         /**
          * ZStandard mode with dictionary
          */
-        ZSTD("ZSTD", Set.of("zstd")),
+        ZSTD("ZSTD99", Set.of("zstd")),
         /**
          * ZStandard mode without dictionary
          */
-        ZSTD_NO_DICT("ZSTDNODICT", Set.of("zstd_no_dict")),
-        /**
-         * Deprecated ZStandard mode, added for backward compatibility to support indices created in 2.9.0 where
-         * both ZSTD and ZSTD_NO_DICT used Lucene95CustomCodec underneath. This should not be used to
-         * create new indices.
-         */
-        ZSTD_DEPRECATED("Lucene95CustomCodec", Collections.emptySet());
+        ZSTD_NO_DICT("ZSTDNODICT99", Set.of("zstd_no_dict"));
 
         private final String codec;
         private final Set<String> aliases;
@@ -77,7 +71,7 @@ public Set<String> getAliases() {
      *
      * @param mode The compression codec (ZSTD or ZSTDNODICT).
      */
-    public Lucene95CustomCodec(Mode mode) {
+    public Lucene99CustomCodec(Mode mode) {
         this(mode, DEFAULT_COMPRESSION_LEVEL);
     }
 
@@ -89,9 +83,9 @@ public Lucene95CustomCodec(Mode mode) {
      * @param mode The compression codec (ZSTD or ZSTDNODICT).
      * @param compressionLevel The compression level.
      */
-    public Lucene95CustomCodec(Mode mode, int compressionLevel) {
-        super(mode.getCodec(), new Lucene95Codec());
-        this.storedFieldsFormat = new Lucene95CustomStoredFieldsFormat(mode, compressionLevel);
+    public Lucene99CustomCodec(Mode mode, int compressionLevel) {
+        super(mode.getCodec(), new Lucene99Codec());
+        this.storedFieldsFormat = new Lucene99CustomStoredFieldsFormat(mode, compressionLevel);
     }
 
     /**
@@ -104,9 +98,9 @@ public Lucene95CustomCodec(Mode mode, int compressionLevel) {
      * @param mapperService The mapper service.
      * @param logger The logger.
      */
-    public Lucene95CustomCodec(Mode mode, int compressionLevel, MapperService mapperService, Logger logger) {
-        super(mode.getCodec(), new PerFieldMappingPostingFormatCodec(Lucene95Codec.Mode.BEST_SPEED, mapperService, logger));
-        this.storedFieldsFormat = new Lucene95CustomStoredFieldsFormat(mode, compressionLevel);
+    public Lucene99CustomCodec(Mode mode, int compressionLevel, MapperService mapperService, Logger logger) {
+        super(mode.getCodec(), new PerFieldMappingPostingFormatCodec(Lucene99Codec.Mode.BEST_SPEED, mapperService, logger));
+        this.storedFieldsFormat = new Lucene99CustomStoredFieldsFormat(mode, compressionLevel);
     }
 
     @Override

@@ -17,15 +17,17 @@
 import org.apache.lucene.index.SegmentInfo;
 import org.apache.lucene.store.Directory;
 import org.apache.lucene.store.IOContext;
+import org.opensearch.index.codec.customcodecs.backward_codecs.Lucene95CustomCodec;
 
 import java.io.IOException;
 import java.util.Objects;
 
 /** Stored field format used by pluggable codec */
-public class Lucene95CustomStoredFieldsFormat extends StoredFieldsFormat {
+public class Lucene99CustomStoredFieldsFormat extends StoredFieldsFormat {
 
     /** A key that we use to map to a mode */
-    public static final String MODE_KEY = Lucene95CustomStoredFieldsFormat.class.getSimpleName() + ".mode";
+    public static final String LUCENE95_MODE_KEY = "Lucene95CustomStoredFieldsFormat.mode";
+    public static final String MODE_KEY = Lucene99CustomStoredFieldsFormat.class.getSimpleName() + ".mode";
 
     protected static final int ZSTD_BLOCK_LENGTH = 10 * 48 * 1024;
     protected static final int ZSTD_MAX_DOCS_PER_BLOCK = 4096;
@@ -34,21 +36,21 @@ public class Lucene95CustomStoredFieldsFormat extends StoredFieldsFormat {
     private final CompressionMode zstdCompressionMode;
     private final CompressionMode zstdNoDictCompressionMode;
 
-    private final Lucene95CustomCodec.Mode mode;
+    private final Lucene99CustomCodec.Mode mode;
     private final int compressionLevel;
 
     /** default constructor */
-    public Lucene95CustomStoredFieldsFormat() {
-        this(Lucene95CustomCodec.Mode.ZSTD, Lucene95CustomCodec.DEFAULT_COMPRESSION_LEVEL);
+    public Lucene99CustomStoredFieldsFormat() {
+        this(Lucene99CustomCodec.Mode.ZSTD, Lucene99CustomCodec.DEFAULT_COMPRESSION_LEVEL);
     }
 
     /**
      * Creates a new instance.
      *
      * @param mode The mode represents ZSTD or ZSTDNODICT
      */
-    public Lucene95CustomStoredFieldsFormat(Lucene95CustomCodec.Mode mode) {
-        this(mode, Lucene95CustomCodec.DEFAULT_COMPRESSION_LEVEL);
+    public Lucene99CustomStoredFieldsFormat(Lucene99CustomCodec.Mode mode) {
+        this(mode, Lucene99CustomCodec.DEFAULT_COMPRESSION_LEVEL);
     }
 
     /**
@@ -57,7 +59,7 @@ public Lucene95CustomStoredFieldsFormat(Lucene95CustomCodec.Mode mode) {
      * @param mode The mode represents ZSTD or ZSTDNODICT
      * @param compressionLevel The compression level for the mode.
      */
-    public Lucene95CustomStoredFieldsFormat(Lucene95CustomCodec.Mode mode, int compressionLevel) {
+    public Lucene99CustomStoredFieldsFormat(Lucene99CustomCodec.Mode mode, int compressionLevel) {
         this.mode = Objects.requireNonNull(mode);
         this.compressionLevel = compressionLevel;
         zstdCompressionMode = new ZstdCompressionMode(compressionLevel);
@@ -73,12 +75,17 @@ public Lucene95CustomStoredFieldsFormat(Lucene95CustomCodec.Mode mode, int compr
     */
     @Override
     public StoredFieldsReader fieldsReader(Directory directory, SegmentInfo si, FieldInfos fn, IOContext context) throws IOException {
-        String value = si.getAttribute(MODE_KEY);
-        if (value == null) {
+        if (si.getAttribute(LUCENE95_MODE_KEY) != null) {
+            String value = si.getAttribute(LUCENE95_MODE_KEY);
+            Lucene95CustomCodec.Mode mode = Lucene95CustomCodec.Mode.valueOf(value);
+            return impl(mode).fieldsReader(directory, si, fn, context);
+        } else if (si.getAttribute(MODE_KEY) !=null){
+            String value = si.getAttribute(MODE_KEY);
+            Lucene99CustomCodec.Mode mode = Lucene99CustomCodec.Mode.valueOf(value);
+            return impl(mode).fieldsReader(directory, si, fn, context);
+        } else {
             throw new IllegalStateException("missing value for " + MODE_KEY + " for segment: " + si.name);
         }
-        Lucene95CustomCodec.Mode mode = Lucene95CustomCodec.Mode.valueOf(value);
-        return impl(mode).fieldsReader(directory, si, fn, context);
     }
 
     /**
@@ -98,31 +105,40 @@ public StoredFieldsWriter fieldsWriter(Directory directory, SegmentInfo si, IOCo
         return impl(mode).fieldsWriter(directory, si, context);
     }
 
+    StoredFieldsFormat impl(Lucene99CustomCodec.Mode mode) {
+        switch (mode) {
+            case ZSTD:
+                return getCustomCompressingStoredFieldsFormat("CustomStoredFieldsZstd", this.zstdCompressionMode);
+            case ZSTD_NO_DICT:
+                return getCustomCompressingStoredFieldsFormat("CustomStoredFieldsZstdNoDict", this.zstdNoDictCompressionMode);
+            default:
+                throw new AssertionError();
+        }
+    }
+
     StoredFieldsFormat impl(Lucene95CustomCodec.Mode mode) {
         switch (mode) {
             case ZSTD:
             case ZSTD_DEPRECATED:
-                return new Lucene90CompressingStoredFieldsFormat(
-                    "CustomStoredFieldsZstd",
-                    zstdCompressionMode,
-                    ZSTD_BLOCK_LENGTH,
-                    ZSTD_MAX_DOCS_PER_BLOCK,
-                    ZSTD_BLOCK_SHIFT
-                );
+                return getCustomCompressingStoredFieldsFormat("CustomStoredFieldsZstd", this.zstdCompressionMode);
             case ZSTD_NO_DICT:
-                return new Lucene90CompressingStoredFieldsFormat(
-                    "CustomStoredFieldsZstdNoDict",
-                    zstdNoDictCompressionMode,
-                    ZSTD_BLOCK_LENGTH,
-                    ZSTD_MAX_DOCS_PER_BLOCK,
-                    ZSTD_BLOCK_SHIFT
-                );
+                return getCustomCompressingStoredFieldsFormat("CustomStoredFieldsZstdNoDict", this.zstdNoDictCompressionMode);
             default:
                 throw new AssertionError();
         }
     }
 
-    public Lucene95CustomCodec.Mode getMode() {
+    private StoredFieldsFormat getCustomCompressingStoredFieldsFormat(String formatName, CompressionMode compressionMode) {
+        return new Lucene90CompressingStoredFieldsFormat(
+                formatName,
+                compressionMode,
+                ZSTD_BLOCK_LENGTH,
+                ZSTD_MAX_DOCS_PER_BLOCK,
+                ZSTD_BLOCK_SHIFT
+        );
+    }
+
+    public Lucene99CustomCodec.Mode getMode() {
         return mode;
     }
 
@@ -134,7 +150,7 @@ public int getCompressionLevel() {
     }
 
     public CompressionMode getCompressionMode() {
-        return mode == Lucene95CustomCodec.Mode.ZSTD_NO_DICT ? zstdNoDictCompressionMode : zstdCompressionMode;
+        return mode == Lucene99CustomCodec.Mode.ZSTD_NO_DICT ? zstdNoDictCompressionMode : zstdCompressionMode;
     }
 
 }
@@ -20,12 +20,12 @@
 /**
  * ZstdCodec provides ZSTD compressor using the <a href="https://github.com/luben/zstd-jni">zstd-jni</a> library.
  */
-public class ZstdCodec extends Lucene95CustomCodec implements CodecSettings, CodecAliases {
+public class Zstd99Codec extends Lucene99CustomCodec implements CodecSettings, CodecAliases {
 
     /**
      * Creates a new ZstdCodec instance with the default compression level.
      */
-    public ZstdCodec() {
+    public Zstd99Codec() {
         this(DEFAULT_COMPRESSION_LEVEL);
     }
 
@@ -34,7 +34,7 @@ public ZstdCodec() {
      *
      * @param compressionLevel The compression level.
      */
-    public ZstdCodec(int compressionLevel) {
+    public Zstd99Codec(int compressionLevel) {
         super(Mode.ZSTD, compressionLevel);
     }
 
@@ -45,7 +45,7 @@ public ZstdCodec(int compressionLevel) {
      * @param logger The logger.
      * @param compressionLevel The compression level.
      */
-    public ZstdCodec(MapperService mapperService, Logger logger, int compressionLevel) {
+    public Zstd99Codec(MapperService mapperService, Logger logger, int compressionLevel) {
         super(Mode.ZSTD, compressionLevel, mapperService, logger);
     }
 

@@ -20,12 +20,12 @@
 /**
  * ZstdNoDictCodec provides ZSTD compressor without a dictionary support.
  */
-public class ZstdNoDictCodec extends Lucene95CustomCodec implements CodecSettings, CodecAliases {
+public class ZstdNoDict99Codec extends Lucene99CustomCodec implements CodecSettings, CodecAliases {
 
     /**
      * Creates a new ZstdNoDictCodec instance with the default compression level.
      */
-    public ZstdNoDictCodec() {
+    public ZstdNoDict99Codec() {
         this(DEFAULT_COMPRESSION_LEVEL);
     }
 
@@ -34,7 +34,7 @@ public ZstdNoDictCodec() {
      *
      * @param compressionLevel The compression level.
      */
-    public ZstdNoDictCodec(int compressionLevel) {
+    public ZstdNoDict99Codec(int compressionLevel) {
         super(Mode.ZSTD_NO_DICT, compressionLevel);
     }
 
@@ -45,7 +45,7 @@ public ZstdNoDictCodec(int compressionLevel) {
      * @param logger The logger.
      * @param compressionLevel The compression level.
      */
-    public ZstdNoDictCodec(MapperService mapperService, Logger logger, int compressionLevel) {
+    public ZstdNoDict99Codec(MapperService mapperService, Logger logger, int compressionLevel) {
         super(Mode.ZSTD_NO_DICT, compressionLevel, mapperService, logger);
     }
 

@@ -0,0 +1,94 @@
+/*
+ * SPDX-License-Identifier: Apache-2.0
+ *
+ * The OpenSearch Contributors require contributions made to
+ * this file be licensed under the Apache-2.0 license or a
+ * compatible open source license.
+ */
+
+package org.opensearch.index.codec.customcodecs.backward_codecs;
+
+import org.apache.lucene.codecs.FilterCodec;
+import org.apache.lucene.codecs.StoredFieldsFormat;
+import org.apache.lucene.backward_codecs.lucene95.Lucene95Codec;
+import org.opensearch.index.codec.customcodecs.Lucene99CustomStoredFieldsFormat;
+
+import java.util.Collections;
+import java.util.Set;
+
+/**
+ *
+ * Extends {@link FilterCodec} to reuse the functionality of Lucene Codec.
+ * Supports two modes zstd and zstd_no_dict.
+ * Uses Lucene95 as the delegate codec
+ *
+ * @opensearch.internal
+ */
+public abstract class Lucene95CustomCodec extends FilterCodec {
+
+    /** Default compression level used for compression */
+    public static final int DEFAULT_COMPRESSION_LEVEL = 3;
+
+    /** Each mode represents a compression algorithm. */
+    public enum Mode {
+        /**
+         * ZStandard mode with dictionary
+         */
+        ZSTD("ZSTD", Set.of("zstd")),
+        /**
+         * ZStandard mode without dictionary
+         */
+        ZSTD_NO_DICT("ZSTDNODICT", Set.of("zstd_no_dict")),
+        /**
+         * Deprecated ZStandard mode, added for backward compatibility to support indices created in 2.9.0 where
+         * both ZSTD and ZSTD_NO_DICT used Lucene95CustomCodec underneath. This should not be used to
+         * create new indices.
+         */
+        ZSTD_DEPRECATED("Lucene95CustomCodec", Collections.emptySet());
+
+        private final String codec;
+        private final Set<String> aliases;
+
+        Mode(String codec, Set<String> aliases) {
+            this.codec = codec;
+            this.aliases = aliases;
+        }
+
+        /**
+         * Returns the Codec that is registered with Lucene
+         */
+        public String getCodec() {
+            return codec;
+        }
+
+        /**
+         * Returns the aliases of the Codec
+         */
+        public Set<String> getAliases() {
+            return aliases;
+        }
+    }
+
+    private final StoredFieldsFormat storedFieldsFormat;
+
+    /**
+     * Creates a new compression codec.
+     *
+     * @param mode The compression codec (ZSTD or ZSTDNODICT).
+     */
+
+    public Lucene95CustomCodec(Mode mode) {
+        super(mode.getCodec(), new Lucene95Codec());
+        this.storedFieldsFormat = new Lucene99CustomStoredFieldsFormat();
+    }
+
+    @Override
+    public StoredFieldsFormat storedFieldsFormat() {
+        return storedFieldsFormat;
+    }
+
+    @Override
+    public String toString() {
+        return getClass().getSimpleName();
+    }
+}