Assistant in Python with memory

So, I made this code in order to maintain a conversation with memory using chat completions only. I could not do the same in a thread with a assistant previosly configurated. Does someone know how? I need to call the assistant, create the thread and maintain it trough the user interation in python console.

from openai import OpenAI
from dotenv import load_dotenv
import os

cliente = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
modelo = "gpt-4o"

prompt_sistema = """Você é uma assistente..."""

def salvar_historico(mensagem):
    with open("historico_conversa4.json", "a") as historico:
        historico.write(mensagem + "\n")

def main(prompt_sistema, prompt_usuario):
    resposta =
                "role": "system",
                "content": prompt_sistema
                "role": "user",
                "content": prompt_usuario
    return resposta

def recycle(prompt_sistema, resposta):
    while True:
        prompt_usuario = input('Me atualize com detalhes sobre o caso atual ou digite "sair" para encerrar: ')
        if prompt_usuario.lower() == "sair":
            print("Conversa encerrada.")
        # Salva a entrada do usuário no histórico
        salvar_historico("Usuário: " + prompt_usuario)
        prompt_sistema = f"resposta anterior: {resposta.choices[0].message.content}\n\n" + prompt_sistema
        resposta = main(prompt_sistema, prompt_usuario)
        # Salva a resposta do sistema no histórico
        salvar_historico("Eva: " + resposta.choices[0].message.content)
    return prompt_sistema, resposta

# Executa a primeira interação
prompt_usuario = input('Digite o caso clínico com detalhes.')
resposta = main(prompt_sistema, prompt_usuario)

# Salva a entrada inicial do usuário no histórico
salvar_historico("Usuário: " + prompt_usuario)

# Salva a primeira resposta no histórico
salvar_historico("Eva: " + resposta.choices[0].message.content)


# Executa o ciclo de reciclagem em loop
prompt_sistema, resposta = recycle(prompt_sistema, resposta)

I did this. It does not work as good as chat completions though.

There you go.

import time
from openai import OpenAI
from dotenv import load_dotenv
import os

# Carregar as variáveis de ambiente

# Cliente da OpenAI com chave de API
cliente = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

# Definir o ID do assistente criado na plataforma OpenAI
assistente_id = "-------"  # Substitua pelo ID do seu assistente

# Criar uma nova thread para a conversa
thread_vazia = cliente.beta.threads.create()
print(f"Thread criada: {}")

# Função para enviar mensagens e processar respostas
def enviar_mensagem(mensagem_usuario, thread_id):
    # Enviar mensagem do usuário para a thread

    # Executar o assistente e obter a resposta
    run = cliente.beta.threads.runs.create(
    # Tentar recuperar a última mensagem da thread com retries
    for _ in range(5):  # Tentar até 5 vezes
        time.sleep(2)  # Aguardar 2 segundos antes de tentar novamente
        mensagens_thread = cliente.beta.threads.messages.list(thread_id)

        # Procurar a resposta da Eva
        for mensagem in
            if mensagem.role == "assistant":
                if isinstance(mensagem.content, list):
                    resposta = "\n".join([bloco.text.value for bloco in mensagem.content if bloco.type == 'text'])
                    resposta = mensagem.content
                # Retorna a resposta se encontrada
                if resposta:
                    return resposta

    # Se não encontrar uma resposta válida após 5 tentativas
    return "Desculpe, não consegui gerar uma resposta no momento."

# Função para interagir com o usuário e manter a conversa
def iniciar_conversa():
    print("Eva: Digite o caso clínico com detalhes.")
    mensagem_usuario = input("Usuário: ")
    # Primeira interação
    resposta_eva = enviar_mensagem(mensagem_usuario,
    print(f"Eva: {resposta_eva}")

    while True:
        mensagem_usuario = input("Usuário: ")
        if mensagem_usuario.lower() == "sair":
            print("Eva: Caso encerrado. Gerando resumo do caso.")
            resumo_json = enviar_mensagem("Caso encerrado",
        # Responder com as novas atualizações
        resposta_eva = enviar_mensagem(mensagem_usuario,
        print(f"Eva: {resposta_eva}")

# Iniciar a conversa

New models in ChatGPT have been modified silently, with quite apparent tool-use post-training on using the memory, and the behavior has significantly changed.

The AI will try to produce refusals for things that attempt to alter behavior, and now phrases messages about you with the assumed tone “The user likes pizza with pineapple” instead of what might be instructed by the tool’s language or might be generally preserved about an ongoing chat scenario.

You can not place your own tools to replicate this model input or activate trained behavior, nor create tool recipients. You can only use functions. You aren’t meant to compete at the same level as OpenAI’s own product, apparently.

The message that the AI receives with memories is an assistant role message, using the name parameter to set the name to model_editable_context. It follows after the system message of ChatGPT’s identity and tools and system message of custom instructions, and begins with a heading # Model Set Context, and memory items are placed with an index number with a date prefix in square brackets, so you can somewhat emulate the memories themselves with additional_instructions if they need to change mid-conversation, or you can place them permanently at the start of a thread as assistant before the first user input, only then able to inform other sessions.


# Model Set Context

1. [2024-08-19]. The user has a cat named Picard.

2. [2024-09-01]. The user has a pinball machine collection.

3. [2024-09-03]. Storing new memories is disabled.

If the memory begins “The user”, this is stripped from the memory shown in user interface settings, but is placed into context.

The bio tool is also AI powered. ChatGPT can send something like “forget about pinball machines” and the tool AI will fulfill the changes with its focused purpose.

I cannot see why you’d want this particular ChatGPT behavior in most applications though; it is poor quality, and doubles the cost of getting a response with multiple calls besides the lengthened context.