Szuk.AI Embeddings - Furniture Similarity Search

Advanced AI-powered furniture similarity search system using CLIP, DINOv2, and OpenAI embeddings with FAISS indexing.

🎯 Features

Multi-modal embeddings: CLIP (visual) + DINOv2 (features) + OpenAI (text)
Large model support: ViT-L/14@336px + DINOv2 giant
Concatenation strategy: 5376-dimensional combined embeddings
Two-stage search: Coarse retrieval → re-ranking → top results
Background removal: Automated with Rembg
Async processing: Background tasks for large datasets
RunPod ready: One-click deployment on GPU cloud
Git LFS: Efficient storage for FAISS indexes

🚀 Quick Deploy (RunPod)

curl -sSL https://raw.githubusercontent.com/matthiaskaminski/embeddings/main/setup.sh | bash

📊 Architecture

Models Used

CLIP ViT-L/14@336px: 768-dim visual embeddings
DINOv2 Giant: 1536-dim advanced visual features
OpenAI text-embedding-3-large: 3072-dim text features
Combined: 5376-dim concatenated embeddings

Workflow

Image preprocessing → Background removal
Multi-scale processing → 224px, 336px, 448px
Feature extraction → Visual + text embeddings
FAISS indexing → Fast similarity search
Two-stage search → 1750 → 300 → 6-8 results

🔧 API Endpoints

Build & Management

# Build new indexes
POST /faiss/build-async
{
  "products": [
    {
      "id": 1,
      "image_url": "https://...",
      "features": {
        "kolor": "szary", 
        "material": "tkanina",
        "typ": "sofa"
      }
    }
  ]
}

# Add products to existing indexes  
POST /faiss/add-async
{
  "products": [...],
  "append": true
}

Search

# Two-stage similarity search
POST /faiss/search/two-stage
{
  "image_url": "https://...",
  "features": {
    "kolor": "beżowy",
    "material": "tkanina"
  },
  "k": 6,
  "remove_background": true,
  "use_multiscale": true
}

Monitoring

# System health
GET /health

# Index statistics
GET /faiss/stats

# Task status
GET /task/{task_id}

🏗️ Local Development

Prerequisites

Python 3.10+
CUDA 11.8+
12GB+ GPU memory
Git LFS

Setup

git clone https://github.com/matthiaskaminski/embeddings.git
cd embeddings
git lfs pull
pip install -r requirements.txt
python app.py

🌐 Production Deployment

RunPod (Recommended)

Create template from runpod-template.md
Deploy: curl setup.sh | bash
Access: ngrok tunnel or public IP
Scale: Start/stop on demand

Docker

docker-compose up -d

Costs

Development: ~$0.60/hour (RTX 4090)
Production: On-demand processing only
Storage: Free with Git LFS (under 2GB)

📈 Performance

Processing Speed

RTX 3060: 3-5 sec/embedding
RTX 4090: 1-2 sec/embedding
A100: 0.5-1 sec/embedding

Search Performance

Index size: 1750 products
Search time: <100ms
Memory usage: 5GB GPU + 8GB RAM

🔐 Security

Authentication

All endpoints require:

X-API-Key: szuk_ai_embeddings_2024_secure_key

Rate Limiting

100 requests/minute per IP
Configurable limits

🛠️ Model Configuration

Switch Models

# Large models (production)
POST /admin/switch-model-size
{"model_size": "large"}

# Small models (development)  
POST /admin/switch-model-size
{"model_size": "small"}

Current Configuration

GET /admin/model-config

📚 Documentation

Deployment Guide - Complete setup instructions
RunPod Template - Template creation guide
Project Details - Technical specifications
Security Info - Security guidelines

🐛 Troubleshooting

Common Issues

Memory errors: Use smaller batch sizes or small models
CUDA errors: Restart pod and check GPU status
LFS timeouts: Increase git timeout settings

Support

# Check logs
tail -f logs/app.log

# Monitor GPU
nvidia-smi

# Test health
curl http://localhost:5000/health

📊 Data Pipeline

Input → Processing → Output

Product Image → Background Removal → Multi-scale Processing
     ↓                    ↓                     ↓
CLIP Embedding ← DINOv2 Embedding ← Text Embedding  
     ↓                    ↓                     ↓
          Concatenation (5376 dims)
                    ↓
              FAISS Indexing
                    ↓
            Similarity Search
                    ↓
             Top 6-8 Results

🎯 Use Cases

E-commerce: Product recommendation
Interior Design: Style matching
Inventory: Similar product search
Content: Visual similarity detection

🚀 Future Enhancements

📄 License

MIT License - See LICENSE file for details

🤝 Contributing

Fork repository
Create feature branch
Commit changes
Push to branch
Create Pull Request

Powered by: PyTorch • CLIP • DINOv2 • FAISS • Flask • RunPod

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
faiss_storage		faiss_storage
.gitattributes		.gitattributes
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
DEPLOYMENT.md		DEPLOYMENT.md
Dockerfile		Dockerfile
README.md		README.md
RUNPOD_SETUP.md		RUNPOD_SETUP.md
SECURITY_INFO.md		SECURITY_INFO.md
SESJA_PODSUMOWANIE_2025-01-19.txt		SESJA_PODSUMOWANIE_2025-01-19.txt
SESJA_PODSUMOWANIE_2025-01-20.txt		SESJA_PODSUMOWANIE_2025-01-20.txt
TUNNEL_SETUP.md		TUNNEL_SETUP.md
app.py		app.py
docker-compose.yml		docker-compose.yml
requirements.txt		requirements.txt
runpod-template.md		runpod-template.md
setup.sh		setup.sh

matthiaskaminski/embeddings

Folders and files

Latest commit

History

Repository files navigation