vector_engine Benchmarks

The vector engine stores embeddings and performs k-nearest neighbor search using cosine similarity.

Store Embedding

Dimension	Time
768	287 ns

Operation	Time
delete	806 ns

Dataset	Time	Per Vector	Mode
1,000 x 128d	242 us	242 ns	Sequential
1,000 x 768d	367 us	367 ns	Sequential
10,000 x 128d	1.93 ms	193 ns	Parallel

SIMD acceleration: 8-wide f32 SIMD (via wide crate) provides 3-9x speedup for cosine similarity
Adaptive parallelism: Uses rayon for parallel search when >5000 vectors (1.6x speedup at 10K)
Linear scaling with dimension: Cosine similarity is O(d) where d is vector dimension
Linear scaling with dataset size: Brute-force search is O(n*d) for n vectors
Memory bound: For 768d vectors, ~3 KB per embedding (768 * 4 bytes)
Search throughput: ~4M vector comparisons/second at 128d (with SIMD)
Store/Get performance: Sub-microsecond for typical embedding sizes

Operation	Time Complexity	Notes
store_embedding	O(d)	Vector copy + hash insert
get_embedding	O(d)	Hash lookup + vector clone
delete_embedding	O(1)	Hash removal
search_similar	O(n*d)	Brute-force scan
compute_similarity	O(d)	Dot product + 2 magnitude calculations

HNSW provides O(log n) search complexity instead of O(n) brute force.

Method	Search Time	Speedup
Brute force	~2 ms	1x
HNSW default	~150 us	~13x

For production workloads at extreme scale (>1M vectors), consider:

vector_engine stores each embedding as a tensor:

emb:{key} -> TensorData { vector: [...] }