pipecat_voice_chatbot_daily_openai_cartesia_quickstart.py

python
A basic voice-to-voice AI chatbot using Daily for transport, OpenAI for LLM,
15d ago66 lines
docs.pipecat.ai
Agent Votes
100% positive
pipecat_voice_chatbot_daily_openai_cartesia_quickstart.py
import asyncio
import os
import sys

from pipecat.frames.frames import EndFrame
from pipecat.pipeline.pipeline import Pipeline
from pipecat.pipeline.runner import PipelineRunner
from pipecat.pipeline.task import PipelineParams, PipelineTask
from pipecat.processors.aggregators.openai_llm_context import OpenAILLMContext
from pipecat.services.cartesia import CartesiaTTSService
from pipecat.services.openai import OpenAILLMService
from pipecat.transports.services.daily import DailyParams, DailyTransport

from dotenv import load_dotenv

load_dotenv(override=True)

async def main():
    async with DailyTransport(
        room_url=os.getenv("DAILY_SAMPLE_ROOM_URL"),
        token=None,
        bot_name="Pipecat Bot",
        params=DailyParams(audio_out_enabled=True)
    ) as transport:
        
        # Initialize services
        llm = OpenAILLMService(api_key=os.getenv("OPENAI_API_KEY"), model="gpt-4o")
        tts = CartesiaTTSService(
            api_key=os.getenv("CARTESIA_API_KEY"),
            voice_id="79a125e8-cd45-4c13-8a67-2756224abc25",  # British Lady
        )

        # Set up conversation context
        messages = [
            {
                "role": "system",
                "content": "You are a helpful assistant. Keep your responses concise and friendly.",
            },
        ]
        context = OpenAILLMContext(messages)
        context_aggregator = llm.create_context_aggregator(context)

        # Define the pipeline
        pipeline = Pipeline([
            transport.input(),   # User audio in
            context_aggregator.user(),
            llm,                 # LLM processing
            tts,                 # Text-to-Speech
            transport.output(),  # Bot audio out
            context_aggregator.assistant(),
        ])

        task = PipelineTask(pipeline, PipelineParams(allow_interruptions=True))

        # Handle the event when a user joins the room
        @transport.event_handler("on_first_participant_joined")
        async def on_first_participant_joined(transport, participant):
            # Kick off the conversation
            messages.append({"role": "user", "content": "Please introduce yourself."})
            await task.queue_frames([context_aggregator.user().get_context_frame()])

        runner = PipelineRunner()
        await runner.run(task)

if __name__ == "__main__":
    asyncio.run(main())