Lately, I’ve been utilizing GPT-4-1106-preview on Azure to develop a demo aimed at evaluating its capabilities. The demo processes questionnaires and generates detailed analyses in Chinese. After completing the prompt engineering last month, the initial results were promising. However, I’ve recently observed a decline in the model’s performance. For previously successful prompts, GPT-4-1106-preview now struggles to adhere to instructions and, at times, produces entirely irrelevant outputs. For instance:
音乐本质上即代表一种跨文化界限共享型国际“共通”语码 —— 它背后隐藏着规则序列模式甚至数学原则……所有这些都暗示着音频波形变换过程中必然牵连紧密联系网络编排布局格局……
另一方面回顾审查检验评价考核记录册单页数据资料信息库存档案香港银行账户余额查询系统显示:“你愿意问别人求助吗?”、“你是否愿意跟团队配合?”、“你是否喜欢单独命数字?”……每项问题背后实则反映出某种社交场景操作程序执行命令代码片断片段剪影截图摘录摘取摘抄摘录笔记本电脑键盘输入输出端口号码密码保护软件下载更新版本历史记录清除工具箱工具栏菜单列表选项设置配置文件保存 路径目录名称标题头衔称号荣誉勋章奖章证书文凭毕业证书驾驶执照营业执照注册登记编号序列号产品货物商品条形码价格标签说明书用户手册操作指南服务电话客服邮箱地址邮政编码城市名称州县镇村庄门牌号楼层数单位房号车牌号飞机票航班日期时间秒钟小时分钟周月年纪元周期轮回轮番替换替补替代品牌商标专利权版权所有作者署名编辑校对打字员打稿员文字处理器排版设计师美术编辑插画家漫 画家游戏设计师权威专家评论员评论文章报道新闻发布会主题演讲嘉宾名单邀请函电子邮件传真电话留声机唱片播放器收音机电台频道广播站网址链接超链接HTML代码CSS样式JavaScript函数PHP脚本SQL数据库MySQL服务器Apache服务器Linux操作系统Windows操作系统MacOS操作系统IOS手机Android手机APP应用程序软件硬件设备配件零部件组装拼装修理保养清洁消毒杀菌消灭虫害治安管理监管监测监控行 政管理司法审裁立法规范制约约束限制禁止令告示板提示信息警告信号灯火警报器急救箱急救车医院药店药品医药费医保金健康码行程码核酸检测报告阳性阴性结果反馔回复评价满意度调查问卷统计数字百分比率份额市场份额销售量销售额利润税收国民生产总值GDP国民收入GNP货币汇率金价油价气候变化环境保护资源节约再利용回收废物处理污水处理厂汽车尾气回收站填海造陆森林覆盖率土壤侵蚀水土 流失治山治水项目工程建设公司企业集团公司商会商务委员会投资银行私募基金风投公司科技园区科技企业初创企业天使投资A轮B轮C轮D轮E轮IPO首次公开募股纳斯达克试试测试测试测试测试测试
These issues are not only perplexing but also disrupt the utility of the model for my project’s purposes. It’s evident to any developer fluent in Chinese that these responses are off-target and lack coherence.
Has anyone else encountered similar issues with GPT-4-1106-preview? I would greatly appreciate any advice or solutions to address this problem. Thank you!