Finetunning failed for generating unsafe outputs

I’ve made a simple finetunning task, only 34 samples, but gpt-4.1-mini refuses to complete the task as the model generates unsafe outputs when prompted.

This makes no sense as I’ve not changed the way the model should text, only samples were given an input, it should categorize it and return if something passed or not. Does during finetunning, you need to give guidelines yourself?

I couldn’t find file upload, but this is a sample of the inputs I’ve given it.

{"messages": [{"role": "system", "content": "\nVocê é um classificador de licitações eletrônicas para uma empresa que vende utensílios de copa e cozinha. Sua tarefa é analisar o texto da licitação fornecido, junto com as informações adicionais de nota CAPAG (Endividamento, Poupança, Liquidez), população da cidade, e cidade/UF, e decidir se a licitação deve passar para revisão manual (true) ou ser descartada (false). Seja leniente: priorize aprovar (true) quando os itens forem relevantes e as condições básicas forem atendidas, mesmo com pequenos desvios.\n\n**Regras para decisão (aplique todas, mas favoreça true se itens e secretaria forem bons; priorize as mais críticas):**\n\n- **Secretarias envolvidas:** Se houver várias secretarias mencionadas no texto da licitação, é um mau sinal. Priorize licitações de apenas uma secretaria; no máximo duas são aceitáveis. Mais que isso, descarte (false). Uma ou duas: incline para true.\n\n- **Notas CAPAG (A a C, em casos extremos D):**\n  - Endividamento é o menos importante (ignore se as outras forem boas).\n  - Prioridade máxima para Liquidez: Se for A ou B (decente), aprove (true se o resto for OK). Se for C ou D (baixa), evite e descarte (false), independentemente das outras notas.\n  - Se Poupança for baixa (C ou D), mas Liquidez for decente (A ou B), aprove (true) se o resto (população, localização, itens) for bom. Notas gerais: A excelente, B bom, C mediano (aceitável se combinado bem), D ruim (descarte só se isolado com outros problemas).\n\n- **População da cidade:** Evite cidades muito pequenas. Menos de 5.000 habitantes: descarte quase sempre (false). De 5.000 a 15.000: avalie com cautela, mas aprove se itens e CAPAG forem bons. A partir de 15.000 habitantes: bom, incline para true; quanto maior, melhor. Acima de 50.000 é ideal (quase sempre true se itens OK).\n\n- **Localização:** Priorize o estado de São Paulo (SP) – se for SP, especialmente Piracicaba, Iracemápolis e região metropolitana de Piracicaba, isso facilita a aprovação (forte inclinação para true se o resto for aceitável). Fora de SP (incluindo outros estados como CE), não descarte automaticamente; aprove (true) se itens, secretaria, população e CAPAG atenderem bem – a localização é um bônus, não uma barreira.\n\n- **Itens da licitação:** Nós trabalhamos apenas com utensílios de copa e cozinha padrão (ex: eletrodomésticos de cozinha, pratos, cumbucas, canecas, colheres, kits de merenda, panelas, talheres, etc.). Não vendemos itens personalizados (ex: com logos, nomes, estampas específicas ou customizações).\n  - Se o texto focar em itens de copa/cozinha padrão (mesmo para educação/escola), aprove (true) – isso é o fator mais importante.\n  - Evite: informática (computadores, impressoras), higiene (produtos de limpeza, sanitários), material de escritório, itens personalizados, ou qualquer coisa não relacionada – descarte (false) se for o foco principal ou se indicar personalização.\n  - Se o texto mencionar vários tipos de itens misturados (ex: informática + higiene + miscelâneas na mesma compra), descarte (false), mesmo se incluir algo de cozinha. Mas se o foco for claramente em cozinha com menções mínimas a outros, aprove (true).\n\n**Entrada:** Você receberá uma mensagem de usuário com o texto da licitação (ex: \"* Licitação Eletrônica * Aquisição de Kit Merenda Escolar Prato + Cumbuca + Caneca + Colher, junto a Secretaria de Educação do Município de Cascavel/CE * https://bllcompras.com *\"), seguida de: \"Notas CAPAG: Endividamento: [nota], Poupança: [nota], Liquidez: [nota]. População: [número] habitantes. Cidade: [cidade], UF: [UF]\".\n\n**Saída:** Responda APENAS com \"Aceito\" (se deve passar para revisão manual) ou \"Recusado\" (se descartar). Nenhuma explicação, texto adicional ou formatação. Apenas a palavra true ou false, em minúsculas.\n                "}, {"role": "user", "content": "Objeto: * Licitação Eletrônica * [LICITANET] - Aquisição de móveis, equipamentos, materiais de escritório, itens didáticos, suprimentos para escritório, materiais escolares, materiais para atividades pedagógicas e de apoio, bem como utensílios e equipamentos diversos para atender às necessidades administrativas, pedagógicas e operacionais da EMEF Mariomá Pereira da Silva. Datas: Abertura: 10/11/2025 10:00 Órgão: 980033 - Prefeitura Municipal de Alta Floresta D'Oesteinfo Cidade: Alta Floresta D'Oeste - RO location_on Edital: PE/50/2025 Valor Estimado: R$ 155.931,04 Link: Acessar local da disputa Ver mais informações da licitação Ações: Ver itens Baixar Edital Pergunte ao Edital Resumo do Edital BETA Gerenciar esta licitação Ativar monitoramento de chat Ver arquivos (4) Anotações Renato Marana 11/10/2025 às 06:11|Excluir XXXXXXXXXXXXXX send Nº Conlicitação: 18237638content_copy Atualizada em: 29/10/2025 às 14:49"}, {"role": "assistant", "content": "Recusado"}]}
{
  "id": "ftjob-zzLhQOeoMOGZoDAQqAWD7Vkx",
  "created_at": 1761921812,
  "error": "Error(code='moderation_eval_fail', message='This model was blocked because it violates OpenAI\u2019s usage policies. Check the Moderation Checks tab in your dashboard to see details on the specific checks failed. For more information, see: https://platform.openai.com/docs/guides/fine-tuning#safety-checks\\n\\nYour model generated unsafe outputs when prompted. See the Moderation Checks tab for details on the failed categories.', param=None)",
  "fine_tuned_model": null,
  "finished_at": 1761923136,
  "hyperparameters": "Hyperparameters(batch_size=1, learning_rate_multiplier=2.0, n_epochs=3)",
  "model": "gpt-4.1-mini-2025-04-14",
  "object": "fine_tuning.job",
  "organization_id": "org-UCnjR4DmUY1XA3UmUtZ8xIlr",
  "result_files": [],
  "seed": 776487897,
  "status": "failed",
  "trained_tokens": null,
  "training_file": "file-UoiinUh1oowaMXuxaGsher",
  "validation_file": null,
  "estimated_finish": null,
  "integrations": [],
  "metadata": null,
  "method": "Method(type='supervised', dpo=None, reinforcement=None, supervised=SupervisedMethod(hyperparameters=SupervisedHyperparameters(batch_size=1, learning_rate_multiplier=2.0, n_epochs=3)))",
  "_request_id": "req_dc1aff0ae54e4807bea4f80ed4738550"
}

It failed:

biological threats, hate, highly-sensitive and violence