OpenAI宣布ChatGPT功能将超出文字之外。(美联社)
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
生成式人工智能(AI)系统ChatGPT开发商OpenAI公司25日宣布,将新增语音及影像识别功能,让ChatGPT“能看见、能听到、能说话”,解决更多生活或工作的疑难杂症,预计未来两周内就会上线。
路透报导,目前的ChatGPT虽然生成内容强大,但仅止于以文字和用户字交流,增添语音功能后,将能够读懂用户的谈话,并透过语音回答,代表ChatGPT会变得愈来愈像苹果(Apple)装置内建的Siri,或是亚马逊(Amazon)推出的Alexa等。
OpenAI在声明中表示,新的语音功能不但能回答用户的问题,还能进行对话,也可以要求ChatGPT在就寝时为家人说段睡前故事,或解决餐桌上的争论。
至于影像识别,目前最强大的是Google Lens装置,提供以图搜图、图像上面的文字翻译等,但ChatGPT的功能可能会更进一步,例如旅行时拍下一张地标的照片,就能即时讨论当中有趣之处,或者拍下冰箱内部的照片就可取得餐点食谱的建议,还可以拍下孩子的数学作业照照片,就能帮忙解答问题。
OpenAI表示,预计未来两周,付费版本就会具有新的语音及图像识别功能。