Add raft-ann-bench script to generate synthetic dataset #2023

tfeher · 2023-11-23T15:43:21Z

This PR adds a Python script to generate synthetic dataset.

tfeher · 2023-11-23T15:46:15Z

python -m raft-ann-bench.generate_dataset --rows 1000000 --cols 128 --dtype float32 dataset/base.fbin

 # After the dataset is generated, you can create query and ground truth files

python -m raft-ann-bench.generate_groundtruth dataset/base.fbin --output=dataset --queries=random --n_queries=10000

divyegala · 2023-11-26T16:17:59Z

python/raft-ann-bench/src/raft-ann-bench/generate_dataset/__main__.py

+import math
+import sys
+
+import cuml


No package of RAFT should depend on cuML, it's a circular dependency otherwise.

cjnolet · 2024-05-21T15:55:03Z

@tfeher this is still a really valuable feature to have. I'm going to push to 24.08, given the looming code freeze. Also cc @dantegd since you are refactoring the Python APIs.

cjnolet · 2024-11-20T22:15:45Z

benchmarking tool has been migrated over to cuvS. Closing.

tfeher added 3 commits November 23, 2023 16:21

Add raft-ann-bench script for synthetic dataset generation

55f7039

Edit benchmark guide

226745c

Add generate_dataset script

e3690ab

tfeher requested review from a team as code owners November 23, 2023 15:43

github-actions bot added cpp python labels Nov 23, 2023

tfeher added non-breaking Non-breaking change Vector Search labels Nov 23, 2023

divyegala requested changes Nov 26, 2023

View reviewed changes

cjnolet assigned tfeher Dec 5, 2023

cjnolet closed this Nov 20, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add raft-ann-bench script to generate synthetic dataset #2023

Add raft-ann-bench script to generate synthetic dataset #2023

tfeher commented Nov 23, 2023

tfeher commented Nov 23, 2023

divyegala Nov 26, 2023

cjnolet commented May 21, 2024

cjnolet commented Nov 20, 2024

Add raft-ann-bench script to generate synthetic dataset #2023

Add raft-ann-bench script to generate synthetic dataset #2023

Conversation

tfeher commented Nov 23, 2023

tfeher commented Nov 23, 2023

divyegala Nov 26, 2023

Choose a reason for hiding this comment

cjnolet commented May 21, 2024

cjnolet commented Nov 20, 2024