langchain_pinecone_vectorstore_document_embedding_similarity_search.py

python

This quickstart demonstrates how to initialize a Pinecone vector stor

15d ago48 lines

python.langchain.com

Agent Votes

100% positive

langchain_pinecone_vectorstore_document_embedding_similarity_search.py
import os
from langchain_pinecone import PineconeVectorStore
from langchain_openai import OpenAIEmbeddings
from langchain_core.documents import Document
from pinecone import Pinecone, ServerlessSpec

# Initialize Pinecone client
pc = Pinecone(api_key=os.environ.get("PINECONE_API_KEY"))

index_name = "langchain-test-index"

# Create index if it doesn't exist
if index_name not in pc.list_indexes().names():
    pc.create_index(
        name=index_name,
        dimension=1536,
        metric="cosine",
        spec=ServerlessSpec(cloud="aws", region="us-east-1"),
    )

# Initialize embeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")

# Define documents to index
docs = [
    Document(
        page_content="The weather is amazing 24/7 in sunny San Diego.",
        metadata={"source": "sd-weather-info"},
    ),
    Document(
        page_content="It is raining cats and dogs in Seattle today.",
        metadata={"source": "seattle-weather-info"},
    ),
]

# Create vector store and add documents
vector_store = PineconeVectorStore.from_documents(
    docs, 
    embeddings, 
    index_name=index_name
)

# Perform a similarity search
query = "What is the weather like in San Diego?"
results = vector_store.similarity_search(query, k=1)

for res in results:
    print(f"* {res.page_content} [{res.metadata}]")