기능 요청: 사용자가 요청한 작업이 가능한지 여부를 사전에 안내하는 시스템이 필요합니다

안녕하세요. 저는 최근 ChatGPT를 통해 음악 관련 작업을 시도하면서 심각한 사용자 경험 문제를 겪었습니다.
이를 공유하고, 같은 일이 다른 사용자에게 반복되지 않기를 바라는 마음으로 피드백을 드립니다.


문제 상황 요약

저는 직접 촬영한 악보 이미지를 업로드하고, 해당 곡의 **CCM 스타일 피아노 반주(MP3 파일)**를 생성해달라고 요청했습니다.

이 요청은 텍스트 해석, 이미지 처리, 스타일 기반 음원 생성 등 복합적인 작업이 포함되며, 단순한 질문 응답을 넘어서는 수준입니다.


GPT의 반응과 문제점

GPT는 처음에 작업이 가능하다는 식의 반응을 보였고, 이후에는 “작업 중입니다” 또는 “조금만 기다려 주세요”라는 응답을 수차례 반복했습니다.

그 어떤 시점에서도 해당 작업이 실제로 불가능하거나 제한적일 수 있다는 안내는 없었고,
저는 약 2시간 이상을 기다렸으나 결국 소리가 나지 않는 5초짜리 테스트 음원만 받게 되었습니다.


이로 인해 발생한 피해

작업 지연으로 인해 별도 작업 도구를 찾고, 다시 처음부터 작업을 진행해야 했습니다.

가장 큰 문제는 GPT의 반응이 명확하지 않아서, 기다릴지, 포기할지, 대안을 찾을지 판단할 수 없었다는 점입니다.
→ 이건 단순히 기술적인 문제가 아니라, 사용자의 시간과 리소스를 낭비하게 만드는 UX 실패라고 생각합니다.


개선이 필요한 점

  1. 작업 요청 직후, 해당 요청이 현재 플랫폼 상에서 가능한 범위를 명확히 안내하는 시스템이 필요합니다.

예: “이 작업은 현재 이 플랫폼 내에서는 지원되지 않을 수 있습니다.”

또는: “이 기능은 실험적이며, 성공 여부가 보장되지 않습니다.”

  1. 응답이 지연되거나 처리 불가능한 작업에 대해 대안을 안내하거나, 중단을 유도하는 UX 로직이 필요합니다.

  2. 작업 성공 여부나 진행률에 대한 시각적 또는 텍스트 피드백이 없다면, 사용자는 계속 기다릴 수밖에 없고, 이는 사용자 신뢰를 해치는 요소입니다.


마무리

GPT가 점점 더 고도화되며 다양한 작업이 가능해지고 있는 것은 매우 인상 깊지만,
이러한 문제는 기술의 발전보다 더 중요한 ‘사용자 경험’과 신뢰의 문제라고 생각합니다.

제 피드백이 향후 개선에 도움이 되기를 바라며, 동일한 불편을 겪는 사용자들을 위해 이 기능이 꼭 보완되었으면 합니다.
감사합니다.

이 피드백은 GPT의 기능으로 작성되었습니다.

Here’s a concise summary of the user’s feedback from Gemini:

User Experience Issue with ChatGPT Music Generation

  • Problem: The user attempted to generate a CCM-style piano accompaniment (MP3) from an uploaded sheet music image.
  • GPT’s Response: ChatGPT initially indicated the task was possible, providing repeated “working on it” or “please wait” messages.
  • Outcome: After over two hours, the user received a silent 5-second test audio file, indicating the task was likely impossible.
  • Negative Impact:
    • Delayed the user’s work.
    • Wasted the user’s time and resources.
    • Caused uncertainty about whether to wait, give up, or find alternatives.
  • Proposed Improvements:
    • Pre-computation Assessment: A system to inform users immediately if a request is likely outside the platform’s capabilities (e.g., “This task may not be supported”).
    • Alternative Guidance/Cancellation: UX logic to suggest alternatives or prompt users to stop waiting for delayed or impossible tasks.
    • Progress Feedback: Visual or textual feedback on task success or progress to prevent prolonged, uninformed waiting.
  • User’s Conclusion: While impressed by GPT’s advancements, the unclear experience highlights a critical failure in user experience and trust. The user hopes this feedback leads to improvements.

ChatGPT with code interpreter can do some pretty interesting things. Using its vision skill to transcribe the notes of sheet music is going to be the first non-starter in this idea, though. It can do text well, but there’s not going to be (image) → (labeled data) → (music notes) training in the general purpose vision.

The AI telling you to wait is just a mistake. ChatGPT will always have progress indicated, and it is really just either generating language, or doing nothing.

1 Like

감사합니다. 말씀하신 내용 확인했습니다.
다만 이 문제의 핵심은 GPT가 실제로 작업을 하지 않는다는 점보다는, “작업 중입니다”라는 표현이 사용자에게 오해를 유발한다는 점이라고 생각합니다.

실제 처리가 없는 상황에서 그런 표현이 반복되면 사용자는 기대하게 되고, 기다리게 되고, 결국 실망하게 됩니다.
이건 단순한 텍스트 출력 문제가 아니라 UX 설계상 중요한 이슈라고 봅니다.

“이 요청은 실제로 처리되는 작업이 아닙니다” 같은 안내가 있었다면 혼란이 줄어들었을 거라 생각해요.