新智元报道
编辑:泽正 好困
【新智元导读】OpenAI发布了支持Windows和macOS的ChatGPT桌面端,这种更加集成化的形式为用户在各种生活与工作的场景下,带来了更好的无缝式交互体验。对于常在桌面端办公的开发者来讲,应用协作功能尤其引人注目并超乎期待。
把消息和代码都要复制粘贴到ChatGPT网页端太麻烦?
之前用户受于没有桌面端而只能机械繁复地去和ChatGPT网页端交互的限制终于要被解决了!
近日OpenAI正式推出了支持Windows和macOS的ChatGPT桌面端。桌面端主要是对于用户在工作生活的各个场景中的功能需求进行了集成。
例如:截屏任意当前页面直接与ChatGPT进行内容交互,任意界面利用快捷键直接呼出ChatGPT实现无缝交互,还有跨应用联动等实际针对用户需求痛点的功能。
让我们来详细看一下本次的桌面端表现具体有多惊艳吧!
你可以通过使用快捷键从桌面上的任意窗口呼出ChatGPT。具体操作为,macOS是Option+Space,而Windows则为Alt+Space。
也可以直接截屏当前页面发送给ChatGPT,让它对当前页面进行解读分析。
桌面端也支持直接调用摄像头拍照,再发送给ChatGPT进行提问。
当然也能直接上传一系列文件交给ChatGPT,让它来为你总结文件里的内容,比如下图就可以直接总结出所有课程任务的Deadline。
至于网络搜索功能则更是基操。
对于广大论文与材料党来讲,更为喜大普奔的是可以直接通过选中文件里的任意文字段落,然后再快捷键触发ChatGPT,即可直接让它给出对于这些段落内容的介绍和具体解释。
对于代码解释和跨应用联动,这次ChatGPT桌面端的测试版本也有着不俗的表现。目前可供ChatGPT Plus和Team用户使用,而ChatGPT Enterprise和Edu用户将在几周内获得访问权限。
它支持Xcode,VSCode,TextEdit这些IDE和各种编辑器,也支持与终端等应用程序之间进行联动。
例如在Xcode中,就可以直接调用ChatGPT来为自己提供代码解释、给出解决报错的可能步骤等有助于提高开发者工作效率的内容。
用户也可以直接在桌面使用高级语音模式,和ChatGPT进行实时聊天,更好地引导自己提出更好地的问题与获取相应的答案来提高工作效率。
桌面端对比网页版更加方便的是,可以直接搜索聊天记录,然后切换到对应的上下文中去回顾或者继续聊天。
Mac桌面端应用协作的开发者真实体验
对于Mac开发者用户来讲,曾经不得不先将Xcode里的代码复制粘贴到ChatGPT网页端,然后再去进行交互。这样无疑是很繁琐,而且对于添加与修改代码对应的程序功能时就更为如此了。
而现在可以直接通过桌面端和Xcode进行应用协作实现无缝交互,像视频中为一个用于实时跟踪国际空间站和宇航员的应用程序,添加在新窗口中显示实时流的功能。
就可以直接从调用桌面端来让ChatGPT给出实现新功能的代码,并选择将代码更新保存到Xcode里对应的项目文件中。然后再利用终端与桌面端的协作来发布这个功能更新到Github。
并且基于在Xcode和终端这两个应用中已经获取到的上下文,若程序遇到任何报错,它还可以帮助排查问题,或者根据终端输出来安装项目程序所缺失的依赖项。
就是这样,通过ChatGPT与Xcode和终端之间不断的应用协作,就可以迭代出一个足以发布的应用程序。
这种集成也标志着开发者生态朝着更加无缝的AI辅助软件开发迈出了重要一步。
对此,网友「GoBliss」的观点颇具启发性:「这很可能就是ChatGPT成为我们计算机中成熟的Agent的第一步,因为它不仅可以阅读,还可以交互,在终端给出建议,甚至可以进行一些简单的debug。」
如何使用macOS应用协作功能
首先,需要确保兼容的应用正在运行。然后,在ChatGPT聊天栏中,点击「应用协作」按钮并选择一个兼容的应用。
接着,聊天栏上方会有一个提示条,显示ChatGPT正在与哪些应用协作。这时在与ChatGPT进行问答交互时,ChatGPT会将这些应用中的内容包含在你的对话窗口中。
(注意:如果没有看到此提示条,说明ChatGPT当前没有与任何应用协作,也不会在你的对话窗口中包含任何额外内容。)
你可以将鼠标悬停在提示条上,查看ChatGPT会在你的消息窗口中包含哪些内容:
点击发送后,ChatGPT将根据「应用协作」功能提供的额外内容和选择来回复。然后就可以在聊天中查看ChatGPT读取了哪些内容:
这些内容将作为你的聊天历史记录的一部分保存在账户中,直到你主动删除。
对于私人数据隐私问题,OpenAI表示不会使用客户发送到产品(例如API和ChatGPT Enterprise)的内容来提高模型性能。
消息中包含哪些内容?
使用编辑器和集成开发环境(IDE)时(如Xcode、VSCode、TextEdit):
ChatGPT会读取最前面窗口中打开的编辑器面板的完整内容,直到达到读取内容上限
如果你在编辑器中选择了特定文本,ChatGPT会优先关注你的选择(同时保留该面板的完整内容作为上下文)
使用终端工具时(如Terminal终端、iTerm终端):
ChatGPT会读取打开窗口的最后200行内容
如果你在窗格中选择了文本,ChatGPT会优先关注所选内容并包含限制范围内的相邻文本
参考资料:
https://openai.com/chatgpt/desktop/
https://help.openai.com/en/articles/10119604-work-with-apps-on-macos