Unified Hyperbolic Spectral Retrieval (UHSR)

UHSR is a next-generation hybrid text retrieval model that seamlessly integrates lexical search (BM25) and semantic search (FAISS/Pinecone) with spectral re-ranking to produce interpretable and normalized relevance scores in the [0,1] range.

⚡ Key Highlights

✅ Hybrid Search: Combines BM25 with dense embeddings.
🔍 Custom Similarity Metrics: Supports cosine, euclidean, mahalanobis, manhattan, chebyshev, jaccard, and hamming.
🎯 Spectral Re-Ranking: Uses Graph Laplacian & Fiedler vector for robust ranking.
📈 Interpretable Scores: Final scores are logistic-normalized in [0,1].
🚀 Scalable & Efficient: Built on FAISS (local) and Pinecone (cloud).
🤖 AI-powered Reranking: Integrates Hugging Face Cross-Encoders and OpenAI Rerankers.

🚀 What is UHSR?

UHSR unifies lexical and semantic retrieval into a single hybrid retrieval pipeline:

Component	Functionality
🔹 Lexical Search	BM25 for keyword-based ranking
🔹 Semantic Search	FAISS (local) or Pinecone (cloud-based) vector search
🔹 Fusion	Logistic Normalization + Harmonic Fusion for score blending
🔹 Spectral Re-Ranking	Graph Laplacian + Fiedler vector for centrality-based refinement
🔹 AI-based Reranking	Hugging Face Cross-Encoder or OpenAI-based rerankers

📌 Features

🔍 Multi-Metric Retrieval: cosine, euclidean, mahalanobis, manhattan, chebyshev, jaccard, hamming
🌐 Pinecone Support: seamless cloud-based semantic search
🤖 AI-Powered Reranking: Hugging Face or OpenAI models
📊 Hybrid Fusion: BM25 + semantic scoring
♾️ Normalized Scores: interpretable [0,1] relevance
📈 Spectral Graph Ranking: enhances candidate ranking stability
🚀 Scalable: FAISS for fast local retrieval

📦 Installation

1️⃣ Install core package

pip install uhsr[cpu]

2️⃣ (Optional) GPU acceleration

pip install uhsr[gpu]

3️⃣ (Optional) Pinecone for cloud-based retrieval

pip install pinecone-client

4️⃣ (Optional) OpenAI-based reranking

pip install openai

⚡ Usage Example

from sentence_transformers import SentenceTransformer
from uhsr import UHSR
import numpy as np

# Sample documents
documents = [
    "Apple releases new iPhone",
    "Tesla's stock price surges",
    "Google announces AI updates",
    "Amazon introduces drone delivery",
    "Microsoft acquires a gaming company"
]

# Load embedding model
model = SentenceTransformer('all-MiniLM-L6-v2')
embeddings = model.encode(documents, normalize_embeddings=True)
query_embedding = model.encode("Did Tesla's stock price go up?", normalize_embeddings=True)

# Initialize UHSR with OpenAI Reranker
retrieval_system = UHSR(
    documents,
    embeddings,
    reranker_type="openai",
    openai_api_key="your-openai-api-key"
)

# Retrieve results
retrieved_docs, scores = retrieval_system.retrieve(
    "Did Tesla's stock price go up?",
    query_embedding,
    top_k=3,
    metric='cosine',
    rerank=True
)

for doc, score in zip(retrieved_docs, scores):
    print(f"{doc} (Score: {score:.4f})")

🌐 Using Pinecone for Scalable Search

retrieval_system = UHSR(
    documents,
    embeddings,
    use_pinecone=True,
    pinecone_api_key="your_pinecone_api_key"
)

retrieved_docs, scores = retrieval_system.retrieve(
    "Did Tesla's stock price go up?",
    query_embedding,
    top_k=3,
    metric='cosine'
)

🎛️ Supported Similarity Metrics

retrieved_docs, scores = retrieval_system.retrieve("query", query_embedding, metric='cosine')      # ✅ Cosine
retrieved_docs, scores = retrieval_system.retrieve("query", query_embedding, metric='euclidean')   # ✅ Euclidean
retrieved_docs, scores = retrieval_system.retrieve("query", query_embedding, metric='mahalanobis') # ✅ Mahalanobis
retrieved_docs, scores = retrieval_system.retrieve("query", query_embedding, metric='manhattan')   # ✅ Manhattan
retrieved_docs, scores = retrieval_system.retrieve("query", query_embedding, metric='chebyshev')   # ✅ Chebyshev
retrieved_docs, scores = retrieval_system.retrieve("query", query_embedding, metric='jaccard')     # ✅ Jaccard
retrieved_docs, scores = retrieval_system.retrieve("query", query_embedding, metric='hamming')     # ✅ Hamming

📂 Repository Structure

uhsr-retrieval/
├── uhsr/
│   ├── core.py             # Main retrieval logic
│   ├── bm25.py             # BM25 implementation
│   ├── faiss_retrieval.py  # FAISS backend
│   ├── vector_db.py        # Pinecone integration
│   ├── similarity.py       # Similarity metrics
│   ├── reranker.py         # AI-based reranking
│   ├── utils.py            # Utility functions
├── examples/
│   ├── example.py
├── README.md
├── setup.py
├── requirements.txt

🎯 Requirements

numpy
sentence-transformers
faiss-cpu / faiss-gpu
pinecone-client
openai

🧪 Running Tests

pytest

Learn more about UHSR on Medium.

🚀 Try UHSR today & supercharge your search!

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
examples		examples
tests		tests
uhsr		uhsr
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
logo.png		logo.png
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Unified Hyperbolic Spectral Retrieval (UHSR)

⚡ Key Highlights

🚀 What is UHSR?

📌 Features

📦 Installation

1️⃣ Install core package

2️⃣ (Optional) GPU acceleration

3️⃣ (Optional) Pinecone for cloud-based retrieval

4️⃣ (Optional) OpenAI-based reranking

⚡ Usage Example

🌐 Using Pinecone for Scalable Search

🎛️ Supported Similarity Metrics

📂 Repository Structure

🎯 Requirements

🧪 Running Tests

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Unified Hyperbolic Spectral Retrieval (UHSR)

⚡ Key Highlights

🚀 What is UHSR?

📌 Features

📦 Installation

1️⃣ Install core package

2️⃣ (Optional) GPU acceleration

3️⃣ (Optional) Pinecone for cloud-based retrieval

4️⃣ (Optional) OpenAI-based reranking

⚡ Usage Example

🌐 Using Pinecone for Scalable Search

🎛️ Supported Similarity Metrics

📂 Repository Structure

🎯 Requirements

🧪 Running Tests

About

Topics

Resources

License

Code of conduct

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages