Address inconsistent scoring in hybrid query results #998

martin-gaievski · 2024-11-21T19:32:12Z

Description

For hybrid query we are using DocIdSetIterator to iterate over doc ids to get the hybrid scores. That is a problem when sub-queries became complex and system switches to iterator with approximation and two phase approach (introduced in 2.13 in scope of #624).

When both two-phase and DocIdSetIterator are in use there is a high chance they will go out of sync and point to different doc ids. This leads to e_o_f_exception described in the GH issue.

Big thanks to @msfroh who pointed that out in opensearch-project/OpenSearch#16660 (comment)

I've added unit tests, but main verification is done manually, as per steps described in here as part of GH issue, mainly it's because some manual steps by installation of analyzer plugin.

Here are request/response after setting up things with nori analyser:

GET {{base_url}}/rag-chunk-500/_search?search_pipeline=nlp-search-pipeline 
{
    "_source": {
      "excludes": "body_chunk_embedding"
    },
    "query": {
        "hybrid": {
            "queries": [
                {
                    "multi_match": {
                        "query": "금융분야 클라우드컴퓨팅서비스 이용 가이드에 따르면, 중대한 변경이나 중요 계약사항 미이행 시 사후보고는 어떻게 해야 하며, 비중요업무의 경우 어떤 규정을 따라야 합니까?",
                        "fields": [
                            "body_chunk_default",
                            "summary",
                            "title"
                        ]
                    }
                },
                {
                  "neural": {
                    "body_chunk_embedding": {
                      "query_text": "금융분야 클라우드컴퓨팅서비스 이용 가이드에 따르면, 중대한 변경이나 중요 계약사항 미이행 시 사후보고는 어떻게 해야 하며, 비중요업무의 경우 어떤 규정을 따라야 합니까?",
                      "model_id": "UXo_ZJMB_dO27nZ9IKL8",
                      "k": 5
                    }
                }
              }
            ]
        }
    }
}

response

{
    "took": 89,
    "timed_out": false,
    "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 235,
            "relation": "eq"
        },
        "max_score": 0.5208311,
        "hits": [
            {
                "_index": "rag-chunk-500",
                "_id": "8HpAZJMB_dO27nZ9mqIq",
                "_score": 0.5208311,
                "_source": {
                    "summary": "이 내용은 금융회사가 보유한 정보에 대한 권한 문제를 다루고 있습니다. 금융회사는 언제든 해당 정보를 조회, 수정, 삭제할 수 있는 권한을 가지며, 클라우드 서비스 제공자는 이를 제한하거나 정보에 대한 권리를 주장할 수 없습니다. 또한 클라우드 서비스 제공자는 관련 법령에 따라 제3자에게 정보를 제공해야 하는 경우 사전에 금융회사에 알려야 하며, 정보 제공 사실을 금지하는 조항이 있을 경우에도 금융위원회 및 금융감독원에 통지해야 합니다.",
                    "body_chunk_default": "금융회사의 소유로서 금융회사는 이 정보에 대해 언제든지 조회 수정 삭제할 수 있는 권리를 가지며 클라우드서비스 제공자는 이를 제한하거나 정보에 대한 어떠한 권리도 주장할 수 없음 클라우드서비스 제공자는 금융회사가 처리를 위탁한 정보를 제3자 국외정부 수사기관 등 포함 에게 제공하도록 규정하는 관련 법령 에 대해 사전에 파악 하여 금융회사에 알려야 함 추가 변경사항 포함 정보 제공 사실을 알리는 것을 금지하는 조항이 있는 경우 해당 조항도 포함하여 금융회사에 알려아 하며 실제 정보제공이 요구되었으나 해당 조항에 따라 금융회사에 알리는 것이 불가한 경우에는 금융위 금감원에 별도 통지할 것 86 금융보안원 제7장 계약 체결 l 해당 법령에 따라 정보제공이 요구되는 경우 정보를 제공하기 전에 금융위 금감원 및 금융회사에 통지하고 관계국의 법령 국가간 상호협정 등에서 정한 적법한 절차에 따라 처리하여야 함 단 원칙적으로 정보주체의 동의를 받도록 하는 개인정보보호법 신용정보의 이용 및 보호에",
                    "auditor": "activate",
                    "title": "금융회사와 클라우드 서비스 제공자 간 정보 처리 및 제공 권한 명시"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "BnpAZJMB_dO27nZ9mqMq",
                "_score": 0.5199528,
                "_source": {
                    "summary": "금융 회사 또는 전자금융업자가 클라우드 컴퓨팅 서비스 제공자와 계약을 체결하고 클라우드 서비스를 이용할 때, 정보 보호 관련 업무를 재위탁할 수 있는 요건을 명시하고 있습니다. 재위탁 시 금융거래 정보의 안전한 관리와 유출 방지를 위해 준수해야 할 사항들을 설명하고 있습니다.",
                    "body_chunk_default": "있어 금융거래 정보의 변경이 필요한 경우 에는 위탁회사 또는 원수탁업자의 개별적 지시에 따라야 하며 위탁회사 또는 원수탁업자는 변경된 정보가 지시 내용에 부합하는지 여부를 확인하여야 함 위탁업무와 관련된 이용자의 금융거래정보는 위탁회사의 전산실 내에 두어야 함 다만 재수탁업자가 이용자의 정보를 어떠한 경우에도 알지 못하도록 위탁회사 또는 원수탁업자가 금융거래정보를 처리하여 제공한 경우에는 위탁회사의 관리 통제하에 재수탁회사 등 제3의 장소로 이전 가능함 법령해석 회신문 200036 20 5 4 클라우드와 관련하여 전자금융감독규정 제60조 제4항의 적용여부 및 해석 요청 질의 요지 전자금융거래법 상 금융회사 또는 전자금융업자가 클라우드컴퓨팅서비스 제공자와 계약을 맺고 클라 우드컴퓨팅서비스를 이용하면서 정보보호와 관련된 업무 역시 위탁한 때 전자금융감독규정 제60조 제4항의 요건을 갖춘 경우 금융회사의 정보보호와 관련된 업무를 재위탁하는 것이 가능한지 여부 특히 금융회사 등이",
                    "auditor": "activate",
                    "title": "금융거래 정보 보호를 위한 위탁 및 재위탁 규정"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "_XpAZJMB_dO27nZ9mqIq",
                "_score": 0.5,
                "_source": {
                    "summary": "금융회사는 클라우드 서비스 제공자와의 관계에서 고객정보 보호와 정보에 대한 통제권을 보장받아야 한다. 정보 암호화, 전용 네트워크 사용, 직원 보안 교육 등 클라우드 서비스 제공자가 준수해야 할 보안 조치들이 명시되어 있다.",
                    "body_chunk_default": "금융회사는 시정조치를 요구할 수 있어야 함 차 고객정보보호 및 비밀유지 규정 준수 시 고려사항 금융회사가 클라우드서비스를 이용하여 처리하는 모든 정보는 금융회사의 소유로서 금융회사는 이 정보에 대해 언제든지 조회 수정 삭제할 수 있는 권리를 가지며 클라우드서비스 제공자는 이를 제한하거나 정보에 대한 어떠한 권리도 주장할 수 없음 클라우드서비스 제공자는 모든 정보 전송 시 암호화 기술을 적용하여야 하며 정보의 비인가 접근 및 유출 등을 방지하기 위해 충분한 보호수단을 적용 하여야 함 클라우드서비스 제공자는 클라우드 서비스를 제공함에 있어 취득한 금융회사 데이터에 대한 비밀유지 서약을 준수하여야 함 클라우드서비스 제공자는 금융회사가 클라우드서비스 제공자와 네트워크 연결이 필요할 경우 전용회선 또는 전용회선과 동등한 보안수준을 갖춘 가상의 전용 회선을 이용할 수 있도록 지원하여야 함 클라우드서비스 제공자는 직원 보안 교육을 주기적으로 실시하고 금융회사가 요청할 경우 교육 계획 및 수행",
                    "auditor": "activate",
                    "title": "금융회사의 클라우드 서비스 이용 및 고객정보보호 규정"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "oHpAZJMB_dO27nZ9mqIq",
                "_score": 0.5,
                "_source": {
                    "summary": "본문은 전자금융감독규정에 따라 금융회사가 비중요 업무와 중요 업무에 대해 수립해야 하는 확보 조치에 대해 설명하고 있습니다. 비중요 업무의 경우 일부 필수사항만 수립하면 되지만, 중요 업무로 판단되는 경우에는 전자금융감독규정의 전체 요구사항을 준수해야 합니다. 또한 클라우드 컴퓨팅 서비스 이용 시에도 업무 연속성 계획 및 안전성 확보 조치를 취해야 합니다.",
                    "body_chunk_default": "확보조치의 수립 시행 단 제1호의 평가를 통해 비중요업무로 분류된 업무에 대해서는 별표 2의2 및 별표 2의4 의 필수사항만 수립 시행할수 있다 제4항에 따라 금융감독원장에게 보고할 경우 첨부해야 하는 서류는 다음 각 호와 같다 4 제1항제3호에 따른 업무 연속성 계획 및 안전성 확보조치에 관한 사항 6 별표 2의5 의 계약서 주요 기재사항을 포함한 클라우드 컴퓨팅서비스 이용계약서 금융회사는 클라우드서비스 이용 시에도 전자금융감독규정의 요구사항을 모두 준수 하여야 하며 업무 연속성 계획 및 안전성 확보조치 방안 마련 시 전자금융 감독규정 별표 2의3 별표 2의4 별표 2의5 와 같은 규제 준수가 필요한 사항을 반드시 고려하여야 함 감독규정 제14조의2 제8항에 따른 예외 사항 제외 더불어 클라우드컴퓨팅서비스 이용과 관련한 업무연속성 계획 및 안전성 확보 조치의 수립 시행 시 중요업무로 판단된 경우 전자금융감독규정 별표 2의3 별표 2의4 별표 2의5 에서 명시된 필수사항 및",
                    "auditor": "activate",
                    "title": "전자금융감독규정상 비중요 업무와 중요 업무에 대한 확보 조치"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "PnpAZJMB_dO27nZ9mqMq",
                "_score": 0.48165405,
                "_source": {
                    "summary": "이 텍스트는 금융기관이 클라우드 컴퓨팅 서비스를 이용하는 경우 관련된 보고 및 정보공개 의무사항을 설명하고 있습니다. 주요 내용으로는 i 중대한 변경사항 발생 시 3개월 이내 사후보고 의무, ii 계약 미이행 등 비중요 업무에 대한 반기현황 사후보고 의무, iii 금융보안원에서 발행한 금융분야 클라우드 컴퓨팅 서비스 이용 가이드라인 등이 있습니다.",
                    "body_chunk_default": "사후보고 23 6 1 CSP 합병 등 개정 감독규정 적용 중대변경 안전성 확보 중대한 변경 또는 중요 계약사항 미이행 시로부터 3개월 이내 사후보고 관련 계약미이행 등 비중요업무의 경우 개정 감독규정에 따르면 정보처리위탁규정 7 ii에 따른 반기현황 사후보고를 해야 하고 개정 감독규정에 따르면 감독규정 14의2 에 따른 사후보고를 해야 합니다 135 금융분야 클라우드컴퓨팅서비스 이용 가이드 발행일 2023 02월 발행인 김 철 웅 발행처 금융보안원 주 소 경기도 용인시 수지구 대지로 132 비매품 이 가이드 내용의 무단 전재를 금하며 가공 인용할 때에는 반드시 금융보안원 금융분야 클라우드컴퓨팅서비스 이용 가이드 라고 밝혀 주시기 바랍니다",
                    "auditor": "activate",
                    "title": "금융기관의 클라우드 서비스 이용 관련 보고 및 정보 가이드라인"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "CXpAZJMB_dO27nZ9mqMq",
                "_score": 0.416423,
                "_source": {
                    "summary": "이 문서는 금융 기관의 정보 보안 업무에 대해 설명합니다. 정보보호최고책임자(CISO가 인프라 운영, 취약점 분석평가, IT 내부통제 관리 등의 업무를 통솔해야 하며, 이 과정에서 정보 유출을 방지하는 것이 중요합니다. 일반적으로 재위탁이 제한되지만, 전자금융감독규정에 따라 일정한 조건을 준수하는 경우 제한적으로 재위탁을 허용하고 있습니다. 이에 따라 재수탁업자의 정보 변경 절차와 이용자 정보 관리 기준이 규정되어 있습니다.",
                    "body_chunk_default": "인프라 운영과 취약점 분석평가 IT내부통제 관리 등의 업무를 포괄하며 정보의 외부유출 방지 등을 위해 금융회사 등의 정보보호최고책임자 CISO 가 통솔해야 하는 업무 이므로 원칙적으로 재위탁을 제한하되 단서규정을 두어 일정한 조건을 준수하는 경우에 한하여 제한적으로 재위탁을 허용하였습니다 아울러 전자금융감독규정 제60조 제4항 각 호에서는 전자금융거래정보의 보호 목적 달성을 위해 다음과 같이 재위탁의 기준을 구체화하고 있으므로 해당 기준을 준수하는 경우에는 재위탁이 가능 합니다 전자금융감독규정 60 i 재수탁업자가 재위탁된 업무를 처리함에 있어 금융거래 정보의 변경이 필요한 경우에는 위탁회사 또는 원수탁업자의 개별적 지시에 따라야 하고 위탁회사 또는 원수탁업자는 변경된 정보가 지시 내용에 부합하는지 여부를 확인할 것 ii 위탁업무와 관련된 이용자의 금융거래정보는 위탁회사의 전산실 내에 둘 것 다만 재수탁업자가 이용자의 이용자 정보를 어떠한 경우에도 알지 못하도록 위탁회사 또는",
                    "auditor": "activate",
                    "title": "금융 정보 보안: CISO의 역할과 재위탁 규정"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "LnpAZJMB_dO27nZ9mqMq",
                "_score": 0.36809874,
                "_source": {
                    "summary": "해당 문서는 클라우드 아웃소싱 시 고려해야 할 주요 사항에 대해 다루고 있다. 중요 아웃소싱 기업의 경우 보안조치 강화가 필요하며, 중소 기업은 완화된 조치 적용이 가능하다. 클라우드 아웃소싱 계약 체결 시 데이터 처리 및 저장, API 보안, 비즈니스 연속성 관리, 규정 준수 모니터링 등의 요건을 포함해야 한다. 또한 서브 아웃소싱 허용 여부와 공급업체 의존 위험 최소화 방안을 고려해야 한다. 이를 통해 클라우드 투자 속도와 혁신의 이점을 극대화할 수 있다.",
                    "body_chunk_default": "따라 중요 아웃소싱인 경우 보안조치 등을 강화하고 규모 및 복잡성이 적은 기업은 완화된 조치를 적용 가능 집중위험이 확인될 경우 관할당국은 해당 위험을 모니터링하고 잠재적 영향을 평가 중요 클라우드 아웃소싱에 대한 요구사항 계약 관련 세부 정보 포함하여 아웃소싱 레지스터 등록 클라우드 아웃소싱 계약의 결과로 발생할 수 있는 위험 평가 동일한 CSP 사용으로 인한 집중 위험 발생 가능성 고려 CSP에 대한 평판 분석 등 적합성 평가 실시 데이터 처리 및 저장 위치 등을 포함한 서면 계약 요건 API 보안 비즈니스 연속성 관리 규정 준수 모니터링 수행 클라우드 아웃소싱 계약의 종료 가능 여부 평가 서브 아웃소싱 허용 여부를 고려한 아웃소싱 계약 체결 관할 당국에 클라우드 아웃소싱 계획 보고 공급업체 의존 위험 최소화 사례 자료제공 가트너 1 개요 미국의 금융회사인 AgCredit 은 SaaS 서비스 공급업체에 의존될 수 있는 위험을 사전에 해소하여 클라우드 투자 속도와 혁신의 이점을",
                    "auditor": "activate",
                    "title": "클라우드 아웃소싱 관리 및 위험 완화"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "XnpAZJMB_dO27nZ9mqIp",
                "_score": 0.36603695,
                "_source": {
                    "summary": "이 문장은 클라우드컴퓨팅서비스의 다양한 유형에 대해 설명하고 있습니다. 클라우드컴퓨팅서비스는 서비스의 운영 방식과 배치 모델에 따라 프라이빗, 퍼블릭, 커뮤니티, 하이브리드 등으로 나뉠 수 있으며, 상용으로 제공되는 클라우드컴퓨팅서비스는 주로 퍼블릭 방식입니다. 그러나 커뮤니티나 하이브리드 방식의 클라우드시스템도 서비스의 전부 또는 일부를 유상으로 제공한다면 이 법의 적용을 받을 수 있다고 설명하고 있습니다.",
                    "body_chunk_default": "아니합니다 예컨대 협회 단체 등이 전용으로 구축한 클라우드컴퓨팅서비스는 포함되지 않습니다 클라우드컴퓨팅서비스의 유형 클라우드컴퓨팅서비스는 서비스의 운영 방식 배치 모델 에 따라 일반적으로 1 프라이빗 클라우드 컴퓨팅서비스 2 퍼블릭 클라우드컴퓨팅서비스 3 커뮤니티 클라우드컴퓨팅서비스 4 하이브 리드 클라우드컴퓨팅서비스 등으로 나뉩니다 이 중에서 상용으로 제공되는 클라우드컴퓨팅서비스는 주로 퍼블릭 클라우드컴퓨팅서비스입니다 직접 개발 구축 운영 관리하는 경우에는 원칙적으로 이 법에서 규정하고 있는 클라우드컴퓨팅 서비스에 해당하지 않습니다 커뮤니티 클라우드컴퓨팅서비스나 하이브리드 클라우드컴퓨팅서비스도 서비스의 배치 및 운영 방식만 다를 뿐 상용으로 제공이 가능하므로 상용으로 제공 이용되고 있는 한 이 법에서 규정 하고 있는 클라우드컴퓨팅서비스에 포함될 수 있습니다 커뮤니티 하이브리드 등의 방식으로 구축된 클라우드시스템이라도 서비스의 전부 또는 일부를 클라우드컴퓨팅서비스 제공자가 유상으로",
                    "auditor": "activate",
                    "title": "클라우드컴퓨팅서비스의 유형과 범위"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "bnpAZJMB_dO27nZ9mqIq",
                "_score": 0.36191288,
                "_source": {
                    "summary": "금융회사 및 전자금융업자는 자사 클라우드 서비스 이용이 가능하지만, 전자금융감독규정에서 요구하는 절차를 준수해야 합니다. 상용 클라우드 이용 시 위탁계약서 등의 서류 제출은 필요하지 않으나, 상용 클라우드 이용과 관련된 서류를 제출해야 합니다. 또한 스타트업의 개발환경 지원 목적으로 클라우드를 이용할 경우에도 관련 규정을 따라야 합니다.",
                    "body_chunk_default": "따른 서류를 제출할 필요는 없으나 상용 클라우드 이용과 관련된 서류로 대체하여 제출해야 합니다 판단이유 전자금융감독규정 제14조의2에서 자사 클라우드 서비스 이용을 제한하고 있지 않으므로 금융회사 및 전자금융업자는 본인이 운영하는 상용 클라우드 서비스를 이용할 수 있습니다 9 FINANCIAL SECURITY INSTITUTE 적용 범위 관련 법령해석 회신문 및 비조치의견서 다만 이 경우에도 중요도 평가 등 동 규정에서 요구하고 있는 클라우드 이용 절차를 모두 준수해야 합니다 자사 클라우드 서비스 이용에 따른 사전보고시 위탁계약서 등 위탁관계에 따른 서류 제출할 필요는 없으나 상용 클라우드 이용과 관련된 서류로 대체 하여 제출해야 합니다 예 업무위수탁 운영 기준 상용 클라우드 이용에 따른 운영 기준 세부적인 제출서류 및 보고절차는 금융감독원 담당자 02 3145 7424 에게 문의하시기 바랍니다 비조치의견서 190011 19 5 27 스타트업 개발환경 지원 목적의 클라우드 이용시",
                    "auditor": "activate",
                    "title": "금융회사 및 전자금융업자의 상용 클라우드 서비스 이용 관련 규정"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "eXpAZJMB_dO27nZ9mqIq",
                "_score": 0.30663598,
                "_source": {
                    "summary": "이 문서는 금융회사가 클라우드 서비스를 이용할 때 필요한 업무 연속성 계획 및 안전성 확보조치 방안에 대해 설명하고 있습니다. 중요 업무 영역의 경우 필수 항목 전체를 평가해야 하지만, 지정된 클라우드 보안인증을 보유한 제공자를 이용하면 대체 항목을 생략할 수 있습니다. 비중요 업무 영역에서는 필수 항목만 평가하면 됩니다. 금융회사는 클라우드 서비스 이용에 따른 업무 연속성 계획과 안전성 확보조치 방안을 수립해야 합니다.",
                    "body_chunk_default": "또는 전자금융업자에서 자체적으로 수행 침해사고대응기관의 대표평가 결과를 공유받는 경우 활용 가능 중요 업무 이용영역에 대해 필수 대체 항목을 모두 평가해야 하나 지정된 클라우드 보안인증을 클라우드서비스 제공자가 보유 유지 하는 경우 대체 항목 생략 가능 필수 항목 생략 불가 비중요 업무 이용 영역에 대해 필수 항목 평가필요 대체 항목 생략 가능 다 업무 연속성 계획 및 안전성 확보조치 방안 수립 제5장 업무 연속성 계획 출구전략 포함 및 안전성 확보조치 방안 수립 l 금융회사는 클라우드서비스 이용에 따른 업무연속성 계획 안전성 확보조치 방안 등을 수립하여야 한다 17 FINANCIAL SECURITY INSTITUTE 중요 업무 감독규정 별표 2의3 클라우드컴퓨팅서비스 이용과 관련한 업무 연속성 계획 별표 2의4 클라우드컴퓨팅서비스 이용과 관련한 안전성 확보조치에서 필수 추가사항 모두 준수 필요 비중요 업무 업무 연속성 계획 안전성 확보조치에서 필수 사항 준수 필요 추가 사항 생략",
                    "auditor": "activate",
                    "title": "금융회사의 클라우드 서비스 이용을 위한 업무 연속성 계획 및 안전성 확보조치 방안"
                }
            }
        ]
    }
}

I also tested with concurrent segment search, got similar response which is expected

{
    "took": 84,
    "timed_out": false,
    "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 235,
            "relation": "eq"
        },
        "max_score": 0.5208311,
        "hits": [
            {
                "_index": "rag-chunk-500",
                "_id": "8HpAZJMB_dO27nZ9mqIq",
                "_score": 0.5208311,
                "_source": {
                    "summary": "이 내용은 금융회사가 보유한 정보에 대한 권한 문제를 다루고 있습니다. 금융회사는 언제든 해당 정보를 조회, 수정, 삭제할 수 있는 권한을 가지며, 클라우드 서비스 제공자는 이를 제한하거나 정보에 대한 권리를 주장할 수 없습니다. 또한 클라우드 서비스 제공자는 관련 법령에 따라 제3자에게 정보를 제공해야 하는 경우 사전에 금융회사에 알려야 하며, 정보 제공 사실을 금지하는 조항이 있을 경우에도 금융위원회 및 금융감독원에 통지해야 합니다.",
                    "body_chunk_default": "금융회사의 소유로서 금융회사는 이 정보에 대해 언제든지 조회 수정 삭제할 수 있는 권리를 가지며 클라우드서비스 제공자는 이를 제한하거나 정보에 대한 어떠한 권리도 주장할 수 없음 클라우드서비스 제공자는 금융회사가 처리를 위탁한 정보를 제3자 국외정부 수사기관 등 포함 에게 제공하도록 규정하는 관련 법령 에 대해 사전에 파악 하여 금융회사에 알려야 함 추가 변경사항 포함 정보 제공 사실을 알리는 것을 금지하는 조항이 있는 경우 해당 조항도 포함하여 금융회사에 알려아 하며 실제 정보제공이 요구되었으나 해당 조항에 따라 금융회사에 알리는 것이 불가한 경우에는 금융위 금감원에 별도 통지할 것 86 금융보안원 제7장 계약 체결 l 해당 법령에 따라 정보제공이 요구되는 경우 정보를 제공하기 전에 금융위 금감원 및 금융회사에 통지하고 관계국의 법령 국가간 상호협정 등에서 정한 적법한 절차에 따라 처리하여야 함 단 원칙적으로 정보주체의 동의를 받도록 하는 개인정보보호법 신용정보의 이용 및 보호에",
                    "auditor": "activate",
                    "title": "금융회사와 클라우드 서비스 제공자 간 정보 처리 및 제공 권한 명시"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "BnpAZJMB_dO27nZ9mqMq",
                "_score": 0.5199528,
                "_source": {
                    "summary": "금융 회사 또는 전자금융업자가 클라우드 컴퓨팅 서비스 제공자와 계약을 체결하고 클라우드 서비스를 이용할 때, 정보 보호 관련 업무를 재위탁할 수 있는 요건을 명시하고 있습니다. 재위탁 시 금융거래 정보의 안전한 관리와 유출 방지를 위해 준수해야 할 사항들을 설명하고 있습니다.",
                    "body_chunk_default": "있어 금융거래 정보의 변경이 필요한 경우 에는 위탁회사 또는 원수탁업자의 개별적 지시에 따라야 하며 위탁회사 또는 원수탁업자는 변경된 정보가 지시 내용에 부합하는지 여부를 확인하여야 함 위탁업무와 관련된 이용자의 금융거래정보는 위탁회사의 전산실 내에 두어야 함 다만 재수탁업자가 이용자의 정보를 어떠한 경우에도 알지 못하도록 위탁회사 또는 원수탁업자가 금융거래정보를 처리하여 제공한 경우에는 위탁회사의 관리 통제하에 재수탁회사 등 제3의 장소로 이전 가능함 법령해석 회신문 200036 20 5 4 클라우드와 관련하여 전자금융감독규정 제60조 제4항의 적용여부 및 해석 요청 질의 요지 전자금융거래법 상 금융회사 또는 전자금융업자가 클라우드컴퓨팅서비스 제공자와 계약을 맺고 클라 우드컴퓨팅서비스를 이용하면서 정보보호와 관련된 업무 역시 위탁한 때 전자금융감독규정 제60조 제4항의 요건을 갖춘 경우 금융회사의 정보보호와 관련된 업무를 재위탁하는 것이 가능한지 여부 특히 금융회사 등이",
                    "auditor": "activate",
                    "title": "금융거래 정보 보호를 위한 위탁 및 재위탁 규정"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "_XpAZJMB_dO27nZ9mqIq",
                "_score": 0.5,
                "_source": {
                    "summary": "금융회사는 클라우드 서비스 제공자와의 관계에서 고객정보 보호와 정보에 대한 통제권을 보장받아야 한다. 정보 암호화, 전용 네트워크 사용, 직원 보안 교육 등 클라우드 서비스 제공자가 준수해야 할 보안 조치들이 명시되어 있다.",
                    "body_chunk_default": "금융회사는 시정조치를 요구할 수 있어야 함 차 고객정보보호 및 비밀유지 규정 준수 시 고려사항 금융회사가 클라우드서비스를 이용하여 처리하는 모든 정보는 금융회사의 소유로서 금융회사는 이 정보에 대해 언제든지 조회 수정 삭제할 수 있는 권리를 가지며 클라우드서비스 제공자는 이를 제한하거나 정보에 대한 어떠한 권리도 주장할 수 없음 클라우드서비스 제공자는 모든 정보 전송 시 암호화 기술을 적용하여야 하며 정보의 비인가 접근 및 유출 등을 방지하기 위해 충분한 보호수단을 적용 하여야 함 클라우드서비스 제공자는 클라우드 서비스를 제공함에 있어 취득한 금융회사 데이터에 대한 비밀유지 서약을 준수하여야 함 클라우드서비스 제공자는 금융회사가 클라우드서비스 제공자와 네트워크 연결이 필요할 경우 전용회선 또는 전용회선과 동등한 보안수준을 갖춘 가상의 전용 회선을 이용할 수 있도록 지원하여야 함 클라우드서비스 제공자는 직원 보안 교육을 주기적으로 실시하고 금융회사가 요청할 경우 교육 계획 및 수행",
                    "auditor": "activate",
                    "title": "금융회사의 클라우드 서비스 이용 및 고객정보보호 규정"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "oHpAZJMB_dO27nZ9mqIq",
                "_score": 0.5,
                "_source": {
                    "summary": "본문은 전자금융감독규정에 따라 금융회사가 비중요 업무와 중요 업무에 대해 수립해야 하는 확보 조치에 대해 설명하고 있습니다. 비중요 업무의 경우 일부 필수사항만 수립하면 되지만, 중요 업무로 판단되는 경우에는 전자금융감독규정의 전체 요구사항을 준수해야 합니다. 또한 클라우드 컴퓨팅 서비스 이용 시에도 업무 연속성 계획 및 안전성 확보 조치를 취해야 합니다.",
                    "body_chunk_default": "확보조치의 수립 시행 단 제1호의 평가를 통해 비중요업무로 분류된 업무에 대해서는 별표 2의2 및 별표 2의4 의 필수사항만 수립 시행할수 있다 제4항에 따라 금융감독원장에게 보고할 경우 첨부해야 하는 서류는 다음 각 호와 같다 4 제1항제3호에 따른 업무 연속성 계획 및 안전성 확보조치에 관한 사항 6 별표 2의5 의 계약서 주요 기재사항을 포함한 클라우드 컴퓨팅서비스 이용계약서 금융회사는 클라우드서비스 이용 시에도 전자금융감독규정의 요구사항을 모두 준수 하여야 하며 업무 연속성 계획 및 안전성 확보조치 방안 마련 시 전자금융 감독규정 별표 2의3 별표 2의4 별표 2의5 와 같은 규제 준수가 필요한 사항을 반드시 고려하여야 함 감독규정 제14조의2 제8항에 따른 예외 사항 제외 더불어 클라우드컴퓨팅서비스 이용과 관련한 업무연속성 계획 및 안전성 확보 조치의 수립 시행 시 중요업무로 판단된 경우 전자금융감독규정 별표 2의3 별표 2의4 별표 2의5 에서 명시된 필수사항 및",
                    "auditor": "activate",
                    "title": "전자금융감독규정상 비중요 업무와 중요 업무에 대한 확보 조치"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "PnpAZJMB_dO27nZ9mqMq",
                "_score": 0.48165405,
                "_source": {
                    "summary": "이 텍스트는 금융기관이 클라우드 컴퓨팅 서비스를 이용하는 경우 관련된 보고 및 정보공개 의무사항을 설명하고 있습니다. 주요 내용으로는 i 중대한 변경사항 발생 시 3개월 이내 사후보고 의무, ii 계약 미이행 등 비중요 업무에 대한 반기현황 사후보고 의무, iii 금융보안원에서 발행한 금융분야 클라우드 컴퓨팅 서비스 이용 가이드라인 등이 있습니다.",
                    "body_chunk_default": "사후보고 23 6 1 CSP 합병 등 개정 감독규정 적용 중대변경 안전성 확보 중대한 변경 또는 중요 계약사항 미이행 시로부터 3개월 이내 사후보고 관련 계약미이행 등 비중요업무의 경우 개정 감독규정에 따르면 정보처리위탁규정 7 ii에 따른 반기현황 사후보고를 해야 하고 개정 감독규정에 따르면 감독규정 14의2 에 따른 사후보고를 해야 합니다 135 금융분야 클라우드컴퓨팅서비스 이용 가이드 발행일 2023 02월 발행인 김 철 웅 발행처 금융보안원 주 소 경기도 용인시 수지구 대지로 132 비매품 이 가이드 내용의 무단 전재를 금하며 가공 인용할 때에는 반드시 금융보안원 금융분야 클라우드컴퓨팅서비스 이용 가이드 라고 밝혀 주시기 바랍니다",
                    "auditor": "activate",
                    "title": "금융기관의 클라우드 서비스 이용 관련 보고 및 정보 가이드라인"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "CXpAZJMB_dO27nZ9mqMq",
                "_score": 0.416423,
                "_source": {
                    "summary": "이 문서는 금융 기관의 정보 보안 업무에 대해 설명합니다. 정보보호최고책임자(CISO가 인프라 운영, 취약점 분석평가, IT 내부통제 관리 등의 업무를 통솔해야 하며, 이 과정에서 정보 유출을 방지하는 것이 중요합니다. 일반적으로 재위탁이 제한되지만, 전자금융감독규정에 따라 일정한 조건을 준수하는 경우 제한적으로 재위탁을 허용하고 있습니다. 이에 따라 재수탁업자의 정보 변경 절차와 이용자 정보 관리 기준이 규정되어 있습니다.",
                    "body_chunk_default": "인프라 운영과 취약점 분석평가 IT내부통제 관리 등의 업무를 포괄하며 정보의 외부유출 방지 등을 위해 금융회사 등의 정보보호최고책임자 CISO 가 통솔해야 하는 업무 이므로 원칙적으로 재위탁을 제한하되 단서규정을 두어 일정한 조건을 준수하는 경우에 한하여 제한적으로 재위탁을 허용하였습니다 아울러 전자금융감독규정 제60조 제4항 각 호에서는 전자금융거래정보의 보호 목적 달성을 위해 다음과 같이 재위탁의 기준을 구체화하고 있으므로 해당 기준을 준수하는 경우에는 재위탁이 가능 합니다 전자금융감독규정 60 i 재수탁업자가 재위탁된 업무를 처리함에 있어 금융거래 정보의 변경이 필요한 경우에는 위탁회사 또는 원수탁업자의 개별적 지시에 따라야 하고 위탁회사 또는 원수탁업자는 변경된 정보가 지시 내용에 부합하는지 여부를 확인할 것 ii 위탁업무와 관련된 이용자의 금융거래정보는 위탁회사의 전산실 내에 둘 것 다만 재수탁업자가 이용자의 이용자 정보를 어떠한 경우에도 알지 못하도록 위탁회사 또는",
                    "auditor": "activate",
                    "title": "금융 정보 보안: CISO의 역할과 재위탁 규정"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "LnpAZJMB_dO27nZ9mqMq",
                "_score": 0.36809874,
                "_source": {
                    "summary": "해당 문서는 클라우드 아웃소싱 시 고려해야 할 주요 사항에 대해 다루고 있다. 중요 아웃소싱 기업의 경우 보안조치 강화가 필요하며, 중소 기업은 완화된 조치 적용이 가능하다. 클라우드 아웃소싱 계약 체결 시 데이터 처리 및 저장, API 보안, 비즈니스 연속성 관리, 규정 준수 모니터링 등의 요건을 포함해야 한다. 또한 서브 아웃소싱 허용 여부와 공급업체 의존 위험 최소화 방안을 고려해야 한다. 이를 통해 클라우드 투자 속도와 혁신의 이점을 극대화할 수 있다.",
                    "body_chunk_default": "따라 중요 아웃소싱인 경우 보안조치 등을 강화하고 규모 및 복잡성이 적은 기업은 완화된 조치를 적용 가능 집중위험이 확인될 경우 관할당국은 해당 위험을 모니터링하고 잠재적 영향을 평가 중요 클라우드 아웃소싱에 대한 요구사항 계약 관련 세부 정보 포함하여 아웃소싱 레지스터 등록 클라우드 아웃소싱 계약의 결과로 발생할 수 있는 위험 평가 동일한 CSP 사용으로 인한 집중 위험 발생 가능성 고려 CSP에 대한 평판 분석 등 적합성 평가 실시 데이터 처리 및 저장 위치 등을 포함한 서면 계약 요건 API 보안 비즈니스 연속성 관리 규정 준수 모니터링 수행 클라우드 아웃소싱 계약의 종료 가능 여부 평가 서브 아웃소싱 허용 여부를 고려한 아웃소싱 계약 체결 관할 당국에 클라우드 아웃소싱 계획 보고 공급업체 의존 위험 최소화 사례 자료제공 가트너 1 개요 미국의 금융회사인 AgCredit 은 SaaS 서비스 공급업체에 의존될 수 있는 위험을 사전에 해소하여 클라우드 투자 속도와 혁신의 이점을",
                    "auditor": "activate",
                    "title": "클라우드 아웃소싱 관리 및 위험 완화"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "XnpAZJMB_dO27nZ9mqIp",
                "_score": 0.36603695,
                "_source": {
                    "summary": "이 문장은 클라우드컴퓨팅서비스의 다양한 유형에 대해 설명하고 있습니다. 클라우드컴퓨팅서비스는 서비스의 운영 방식과 배치 모델에 따라 프라이빗, 퍼블릭, 커뮤니티, 하이브리드 등으로 나뉠 수 있으며, 상용으로 제공되는 클라우드컴퓨팅서비스는 주로 퍼블릭 방식입니다. 그러나 커뮤니티나 하이브리드 방식의 클라우드시스템도 서비스의 전부 또는 일부를 유상으로 제공한다면 이 법의 적용을 받을 수 있다고 설명하고 있습니다.",
                    "body_chunk_default": "아니합니다 예컨대 협회 단체 등이 전용으로 구축한 클라우드컴퓨팅서비스는 포함되지 않습니다 클라우드컴퓨팅서비스의 유형 클라우드컴퓨팅서비스는 서비스의 운영 방식 배치 모델 에 따라 일반적으로 1 프라이빗 클라우드 컴퓨팅서비스 2 퍼블릭 클라우드컴퓨팅서비스 3 커뮤니티 클라우드컴퓨팅서비스 4 하이브 리드 클라우드컴퓨팅서비스 등으로 나뉩니다 이 중에서 상용으로 제공되는 클라우드컴퓨팅서비스는 주로 퍼블릭 클라우드컴퓨팅서비스입니다 직접 개발 구축 운영 관리하는 경우에는 원칙적으로 이 법에서 규정하고 있는 클라우드컴퓨팅 서비스에 해당하지 않습니다 커뮤니티 클라우드컴퓨팅서비스나 하이브리드 클라우드컴퓨팅서비스도 서비스의 배치 및 운영 방식만 다를 뿐 상용으로 제공이 가능하므로 상용으로 제공 이용되고 있는 한 이 법에서 규정 하고 있는 클라우드컴퓨팅서비스에 포함될 수 있습니다 커뮤니티 하이브리드 등의 방식으로 구축된 클라우드시스템이라도 서비스의 전부 또는 일부를 클라우드컴퓨팅서비스 제공자가 유상으로",
                    "auditor": "activate",
                    "title": "클라우드컴퓨팅서비스의 유형과 범위"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "bnpAZJMB_dO27nZ9mqIq",
                "_score": 0.36191288,
                "_source": {
                    "summary": "금융회사 및 전자금융업자는 자사 클라우드 서비스 이용이 가능하지만, 전자금융감독규정에서 요구하는 절차를 준수해야 합니다. 상용 클라우드 이용 시 위탁계약서 등의 서류 제출은 필요하지 않으나, 상용 클라우드 이용과 관련된 서류를 제출해야 합니다. 또한 스타트업의 개발환경 지원 목적으로 클라우드를 이용할 경우에도 관련 규정을 따라야 합니다.",
                    "body_chunk_default": "따른 서류를 제출할 필요는 없으나 상용 클라우드 이용과 관련된 서류로 대체하여 제출해야 합니다 판단이유 전자금융감독규정 제14조의2에서 자사 클라우드 서비스 이용을 제한하고 있지 않으므로 금융회사 및 전자금융업자는 본인이 운영하는 상용 클라우드 서비스를 이용할 수 있습니다 9 FINANCIAL SECURITY INSTITUTE 적용 범위 관련 법령해석 회신문 및 비조치의견서 다만 이 경우에도 중요도 평가 등 동 규정에서 요구하고 있는 클라우드 이용 절차를 모두 준수해야 합니다 자사 클라우드 서비스 이용에 따른 사전보고시 위탁계약서 등 위탁관계에 따른 서류 제출할 필요는 없으나 상용 클라우드 이용과 관련된 서류로 대체 하여 제출해야 합니다 예 업무위수탁 운영 기준 상용 클라우드 이용에 따른 운영 기준 세부적인 제출서류 및 보고절차는 금융감독원 담당자 02 3145 7424 에게 문의하시기 바랍니다 비조치의견서 190011 19 5 27 스타트업 개발환경 지원 목적의 클라우드 이용시",
                    "auditor": "activate",
                    "title": "금융회사 및 전자금융업자의 상용 클라우드 서비스 이용 관련 규정"
                }
            },
            {
                "_index": "rag-chunk-500",
                "_id": "eXpAZJMB_dO27nZ9mqIq",
                "_score": 0.30663598,
                "_source": {
                    "summary": "이 문서는 금융회사가 클라우드 서비스를 이용할 때 필요한 업무 연속성 계획 및 안전성 확보조치 방안에 대해 설명하고 있습니다. 중요 업무 영역의 경우 필수 항목 전체를 평가해야 하지만, 지정된 클라우드 보안인증을 보유한 제공자를 이용하면 대체 항목을 생략할 수 있습니다. 비중요 업무 영역에서는 필수 항목만 평가하면 됩니다. 금융회사는 클라우드 서비스 이용에 따른 업무 연속성 계획과 안전성 확보조치 방안을 수립해야 합니다.",
                    "body_chunk_default": "또는 전자금융업자에서 자체적으로 수행 침해사고대응기관의 대표평가 결과를 공유받는 경우 활용 가능 중요 업무 이용영역에 대해 필수 대체 항목을 모두 평가해야 하나 지정된 클라우드 보안인증을 클라우드서비스 제공자가 보유 유지 하는 경우 대체 항목 생략 가능 필수 항목 생략 불가 비중요 업무 이용 영역에 대해 필수 항목 평가필요 대체 항목 생략 가능 다 업무 연속성 계획 및 안전성 확보조치 방안 수립 제5장 업무 연속성 계획 출구전략 포함 및 안전성 확보조치 방안 수립 l 금융회사는 클라우드서비스 이용에 따른 업무연속성 계획 안전성 확보조치 방안 등을 수립하여야 한다 17 FINANCIAL SECURITY INSTITUTE 중요 업무 감독규정 별표 2의3 클라우드컴퓨팅서비스 이용과 관련한 업무 연속성 계획 별표 2의4 클라우드컴퓨팅서비스 이용과 관련한 안전성 확보조치에서 필수 추가사항 모두 준수 필요 비중요 업무 업무 연속성 계획 안전성 확보조치에서 필수 사항 준수 필요 추가 사항 생략",
                    "auditor": "activate",
                    "title": "금융회사의 클라우드 서비스 이용을 위한 업무 연속성 계획 및 안전성 확보조치 방안"
                }
            }
        ]
    }
}

Related Issues

#964

Check List

New functionality includes testing.
New functionality has been documented.
API changes companion pull request created.
Commits are signed per the DCO using --signoff.
Public documentation issue/PR created.

By submitting this pull request, I confirm that my contribution is made under the terms of the Apache 2.0 license.
For more information on following Developer Certificate of Origin and signing off your commits, please check here.

codecov · 2024-11-21T21:09:09Z

Codecov Report

All modified and coverable lines are covered by tests ✅

Project coverage is 80.35%. Comparing base (4875dd5) to head (bbe5bac).
Report is 1 commits behind head on main.

Additional details and impacted files

@@             Coverage Diff              @@
##               main     #998      +/-   ##
============================================
+ Coverage     80.29%   80.35%   +0.06%     
  Complexity      997      997              
============================================
  Files            78       78              
  Lines          3405     3411       +6     
  Branches        577      578       +1     
============================================
+ Hits           2734     2741       +7     
  Misses          427      427              
+ Partials        244      243       -1

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

martin-gaievski · 2024-11-23T22:21:11Z

src/test/java/org/opensearch/neuralsearch/query/HybridQueryScorerTests.java

+    }
+
+    @SneakyThrows
+    public void testHybridScores_withTwoPhaseIterator() throws IOException {


this test case would fail with old code

martin-gaievski · 2024-11-25T16:37:21Z

src/main/java/org/opensearch/neuralsearch/query/HybridQueryScorer.java

@@ -30,7 +31,7 @@
 * corresponds to order of sub-queries in an input Hybrid query.
 */
 @Log4j2
-public final class HybridQueryScorer extends Scorer {
+public class HybridQueryScorer extends Scorer {


need to remove final to make this class "mockable"

martin-gaievski · 2024-11-25T16:37:48Z

src/main/java/org/opensearch/neuralsearch/query/HybridQueryScorer.java

@@ -187,7 +189,7 @@ public int docID() {
     */
    public float[] hybridScores() throws IOException {
        float[] scores = new float[numSubqueries];
-        DisiWrapper topList = subScorersPQ.topList();
+        DisiWrapper topList = getSubMatches();


this is main change for this PR

Could you explain here what is the difference between subScorersPQ.topList(); and getSubMatches().

critical difference is the case when we do have two phase iterator, this can happen when underlying doc iterator uses approximation.
In this case getSubMatches() will return approximation based iterator while subScorersPQ.topList() will be exact Disi iterator. Iterator with approximation can skip some doc ids and jump to next block if current block cannot give competitive score, while disi iterator will always go one by one.
This isn't a problem for simpler cases when there is no two phase iterators. We're seeing two phase iterators often for multi_match query cases.

Thanks for the explanation. Just wanted to avoid the case where an engineer change this back to subScorersPQ.topList() in the future and introduce same bug.

makes sense, let me put that as a comment

martin-gaievski · 2024-11-25T17:46:31Z

src/main/java/org/opensearch/neuralsearch/search/collector/HybridTopScoreDocCollector.java

@@ -108,12 +108,17 @@ public void collect(int doc) throws IOException {
                }
                // Increment total hit count which represents unique doc found on the shard
                totalHits++;
+                hitsThresholdChecker.incrementHitCount();


this is a gap team noted while working on the fix, not directly related to reported issue

martin-gaievski · 2024-11-25T19:03:04Z

@peterzhuamazon
Do you have any insights or suggestions regarding failing GH actions ref?

0s
Post job cleanup.
/usr/bin/docker exec  23[1](https://github.com/opensearch-project/neural-search/actions/runs/12016857321/job/33497949352?pr=998#step:9:1)bfad62737a0ba4f5278d97ade3e351a0163404[2](https://github.com/opensearch-project/neural-search/actions/runs/12016857321/job/33497949352?pr=998#step:9:2)5a0f5c41bbcec3796c1412 sh -c "cat /etc/*release | grep ^ID"
/__e/node20/bin/node: /lib64/libm.so.6: version `GLIBC_2.27' not found (required by /__e/node20/bin/node)
/__e/node20/bin/node: /lib64/libc.so.6: version `GLIBC_2.28' not found (required by /__e/node20/bin/node)

I've tried to remove ACTIONS_ALLOW_USE_UNSECURE_NODE_VERSION param as per this suggestion, it's not helping unfortunately.

src/main/java/org/opensearch/neuralsearch/search/collector/HybridTopScoreDocCollector.java

peterzhuamazon · 2024-11-25T19:54:14Z

@peterzhuamazon Do you have any insights or suggestions regarding failing GH actions ref?

0s
Post job cleanup.
/usr/bin/docker exec  23[1](https://github.com/opensearch-project/neural-search/actions/runs/12016857321/job/33497949352?pr=998#step:9:1)bfad62737a0ba4f5278d97ade3e351a0163404[2](https://github.com/opensearch-project/neural-search/actions/runs/12016857321/job/33497949352?pr=998#step:9:2)5a0f5c41bbcec3796c1412 sh -c "cat /etc/*release | grep ^ID"
/__e/node20/bin/node: /lib64/libm.so.6: version `GLIBC_2.27' not found (required by /__e/node20/bin/node)
/__e/node20/bin/node: /lib64/libc.so.6: version `GLIBC_2.28' not found (required by /__e/node20/bin/node)

I've tried to remove ACTIONS_ALLOW_USE_UNSECURE_NODE_VERSION param as per this suggestion, it's not helping unfortunately.

#1002

peterzhuamazon · 2024-11-25T22:52:35Z

Hi @martin-gaievski you can now rebase and fix the conflicts before getting it merged.
All tests should be compatible with AL2 now.

Thanks.

Signed-off-by: Martin Gaievski <[email protected]>

Signed-off-by: Martin Gaievski <[email protected]> (cherry picked from commit 3c7f275)

Signed-off-by: Martin Gaievski <[email protected]> (cherry picked from commit 3c7f275) Co-authored-by: Martin Gaievski <[email protected]>

martin-gaievski added backport 2.x Label will add auto workflow to backport PR to 2.x branch Bug Fixes Changes to a system or product designed to handle a programming bug/glitch labels Nov 21, 2024

martin-gaievski changed the title ~~Switched to approximation/two phase approach for collecting hybrid query scores~~ Address inconsistent scoring in hybrid query results Nov 21, 2024

martin-gaievski force-pushed the fixed_complete_doc_score_mode branch 2 times, most recently from dce2dd3 to 2edefec Compare November 21, 2024 20:59

martin-gaievski commented Nov 23, 2024

View reviewed changes

martin-gaievski commented Nov 25, 2024

View reviewed changes

martin-gaievski added the v2.19.0 label Nov 25, 2024

martin-gaievski marked this pull request as ready for review November 25, 2024 17:44

martin-gaievski requested review from heemin32, navneet1v, VijayanB, vamshin, jmazanec15, naveentatikonda, junqiu-lei, sean-zheng-amazon, model-collapse, zane-neo, vibrantvarun, zhichao-aws, yuye-aws and minalsha as code owners November 25, 2024 17:44

martin-gaievski self-assigned this Nov 25, 2024

martin-gaievski commented Nov 25, 2024

View reviewed changes

martin-gaievski force-pushed the fixed_complete_doc_score_mode branch 2 times, most recently from 32a9754 to ccc5809 Compare November 25, 2024 18:55

heemin32 reviewed Nov 25, 2024

View reviewed changes

src/main/java/org/opensearch/neuralsearch/search/collector/HybridTopScoreDocCollector.java Outdated Show resolved Hide resolved

martin-gaievski force-pushed the fixed_complete_doc_score_mode branch from 693dde6 to 0df0b43 Compare November 25, 2024 19:39

peterzhuamazon mentioned this pull request Nov 25, 2024

Update security runs to also support AL2 on node20 #1002

Merged

1 task

heemin32 approved these changes Nov 25, 2024

View reviewed changes

navneet1v approved these changes Nov 25, 2024

View reviewed changes

martin-gaievski force-pushed the fixed_complete_doc_score_mode branch 2 times, most recently from f53f598 to 8e650b3 Compare November 25, 2024 23:16

Combining all changes in one PR after bad rebase

bbe5bac

Signed-off-by: Martin Gaievski <[email protected]>

martin-gaievski force-pushed the fixed_complete_doc_score_mode branch from 8e650b3 to bbe5bac Compare November 25, 2024 23:57

martin-gaievski merged commit 3c7f275 into opensearch-project:main Nov 26, 2024
41 checks passed

opensearch-trigger-bot bot pushed a commit that referenced this pull request Nov 26, 2024

Combining all changes in one PR after bad rebase (#998)

c059ded

Signed-off-by: Martin Gaievski <[email protected]> (cherry picked from commit 3c7f275)

opensearch-trigger-bot bot mentioned this pull request Nov 26, 2024

[Backport 2.x] Address inconsistent scoring in hybrid query results #1004

Merged

martin-gaievski added a commit that referenced this pull request Nov 26, 2024

Combining all changes in one PR after bad rebase (#998) (#1004)

d83dc5b

Signed-off-by: Martin Gaievski <[email protected]> (cherry picked from commit 3c7f275) Co-authored-by: Martin Gaievski <[email protected]>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Address inconsistent scoring in hybrid query results #998

Address inconsistent scoring in hybrid query results #998

martin-gaievski commented Nov 21, 2024 •

edited

Loading

codecov bot commented Nov 21, 2024 •

edited

Loading

martin-gaievski Nov 23, 2024

martin-gaievski Nov 25, 2024

martin-gaievski Nov 25, 2024

heemin32 Nov 25, 2024

martin-gaievski Nov 25, 2024

heemin32 Nov 25, 2024 •

edited

Loading

martin-gaievski Nov 25, 2024

martin-gaievski Nov 25, 2024

martin-gaievski commented Nov 25, 2024

peterzhuamazon commented Nov 25, 2024

peterzhuamazon commented Nov 25, 2024

Address inconsistent scoring in hybrid query results #998

Address inconsistent scoring in hybrid query results #998

Conversation

martin-gaievski commented Nov 21, 2024 • edited Loading

Description

Related Issues

Check List

codecov bot commented Nov 21, 2024 • edited Loading

Codecov Report

martin-gaievski Nov 23, 2024

Choose a reason for hiding this comment

martin-gaievski Nov 25, 2024

Choose a reason for hiding this comment

martin-gaievski Nov 25, 2024

Choose a reason for hiding this comment

heemin32 Nov 25, 2024

Choose a reason for hiding this comment

martin-gaievski Nov 25, 2024

Choose a reason for hiding this comment

heemin32 Nov 25, 2024 • edited Loading

Choose a reason for hiding this comment

martin-gaievski Nov 25, 2024

Choose a reason for hiding this comment

martin-gaievski Nov 25, 2024

Choose a reason for hiding this comment

martin-gaievski commented Nov 25, 2024

peterzhuamazon commented Nov 25, 2024

peterzhuamazon commented Nov 25, 2024

martin-gaievski commented Nov 21, 2024 •

edited

Loading

codecov bot commented Nov 21, 2024 •

edited

Loading

heemin32 Nov 25, 2024 •

edited

Loading