51CTO首页
AI.x社区
博客
学堂
精品班
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
AIGC创新中国行
IT证书
公众号矩阵
移动端

桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o demo再次惊艳:“能力还是被低估了”

人工智能 新闻
OpenAI工作人员不仅展示了观众期待已久的“视频通话”,还试着让ChatGPT发表了演讲。

GPT-4o桌面端最新Demo,与Sora的新作品一同亮相“欧洲AI春晚”VivaTech。

现场,OpenAI工作人员不仅展示了观众期待已久的“视频通话”,还试着让ChatGPT发表了演讲。

在视频聊天当中,即使给它的只有一幅抽象的简笔画,它也能立马get到这是巴黎地标。

图片

然后再给它看一眼地铁图,指一指当前位置,就能火速设计出乘车路线。

图片

而且,除了能像移动端一样通过摄像头感知环境之外,桌面端的ChatGPT还能够对屏幕内容进行读取,结合代码现场debug。

图片

一系列震撼的演示效果,让前线的Tom’s Guide编辑Ryan Morrison感叹,GPT的语音功能和GPT-4o的潜力,看来是被低估了。

图片

桌面端“视频通话”震撼全场

在现场给400多名观众演示ChatGPT最新功能的,是OpenAI开发者体验主管Romain Huet。

本来Huet打算用手机来演示,结果受到现场技术条件限制无法展示,于是改用Mac,但也正是如此观众们才有机会看到它的屏幕读取能力。

一开始,Huet问ChatGPT能不能给现场的观众讲一点什么,然后ChatGPT真就像模像样地打起了招呼。

不过Huet觉得这样的开场白还不够有气势,于是提示它面前是一大群人,它马上就心领神会,改用了更“燃”的措辞和语气。

当然,Huet没有让ChatGPT一直讲下去,而是在做完开场白之后改由自己来介绍其最新功能。

所有对话,即使跨越语言也能快速响应,现场Huet就要求ChatGPT把自己说的英文翻译成法语,整个过程行云流水。

另外,看上去是bug,但也许是feature的一点是,翻译出的法语还带着一些美国口音,不过Huet表示之后会进行优化,让ChatGPT说外(非英)语时更像当地人。

又是一通补充讲解之后,人们期待的“视频通话”功能终于正式登场了。

只见Huet现场用笔画出了埃菲尔铁塔和凯旋门的草图,结果ChatGPT只看了一眼就直接识破。

Huet自己也打趣地对它说,”非常感谢你,我画的这么烂你都能看懂。”

这还没完,Huet紧接着又掏出了一张巴黎地铁图,用手指了指当前的大概位置。

然后,ChatGPT立刻就给出了前往埃菲尔铁塔的乘车路线,随着Huet的一句Thank You,现场爆发了潮水般的掌声。

当然,最新的ChatGPT不仅能拿来读取摄像头画面,也能实时读取屏幕和剪贴板当中的内容。

作为OpenAI负责开发者体验的主管,Huet和ChatGPT一起现场搞起了代码。

Huet通过复制到剪贴板的方式,让客户端读取了一段React框架编写的网页代码,结果ChatGPT立马就把代码的语言、功能介绍得头头是道。

甚至还当众进行了Debug,通过让ChatGPT读取屏幕,Huet告诉它目前这个网页存在不能根据屏幕宽度进行适配的问题。

通过几轮对话,Huet成功借助ChatGPT的帮助,完美解决了这个问题,再次收获了观众的掌声。

One More Thing

在现场,Huet还播放了一段用Sora为大会创作的新视频,由于现场生成时间较长,观众看到的视频预先制作好的,这也是活动中唯一一个提前做好的效果。

一同展示的还有声音克隆引擎Voice Engine,Huet录制了一段20秒的声音样本,并用VE进行了完美复刻,而且只需一个按钮,就能从英语切换到法语、日语等其他语言,并在Sora中应用。

不过由于安全问题仍未解决,Sora和Voice Engine依旧不能公开发布,想体验的朋友要再等一等了。

另外,说到克隆声音的问题,寡姐和OpenAI关于Sky的争议刚好也有了新消息。

华盛顿邮报称,根据其所获得的文件和录音显示,给Sky配音的女演员的确另有其人。

而且,寡姐所称的受到奥特曼邀请发生在去年9月,而配音演员的招募在5月就已开始。

图片

不过,仍然有网友认为,就算真的是另找了一名演员,也不能说明OpenAI就没有模仿寡姐的意图。

但无论OpenAI的意图如何,真正给Sky配音的演员却是无辜的,也有表演的权利。

不少网友发声对她表示同情:

Sky的配音演员同样有权利使用她自己的声音,难道因为(寡姐)是名人,所拥有的知识产权就比普通人更多吗?

进一步地,我认为虽然“OpenAI侵犯了寡姐的‘公开权’”这个观点比单纯的侵犯知识产权的想法好些,但仍然站不住脚。

图片

总之,寡姐抛向OpenAI的子弹仍未落地,我们不妨一边吃瓜,一边等待着GPT-4o视频对话的正式更新。

责任编辑:张燕妮 来源: 量子位
相关推荐
OpenAI发布新AI模型GPT-4o桌面版ChatGPT
OpenAI新的更新将GPT4带给所有人,包括OpenAI的免费用户,技术主管MiraMurati在直播活动中表示。

2024-05-14 11:29:15

GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了
OpenAI最新旗舰大模型GPT4o,不仅免费可用,能力更是横跨听图片、看图片、说图片,丝滑流畅毫无延迟,就像在打一个视频电话。

2024-05-14 07:20:49

模型 AI
GPT-4o与SQL:大模型改变自身架构的能力有多强?
我毫不怀疑,随着时间的推移,大型语言模型与专业化的某种结合将逐步解决这些工程问题,但目前我们应该为GPT4o能够高效地生成和修改合理架构的能力而感到胜利。

2024-06-05 13:09:26

一文读懂 GPT-4o vs GPT-4 Turbo
GPT4o作为OpenAI最新推出的多模态大模型,其性能与前代GPT4Turbo相比,具有质的飞跃。这里,我们可以从如下个关键方面对两者进行对比分析。

2024-05-21 12:23:17

GPT-4o 的高阶用法,效率飞升!
主流的prompt格式都是采用Markdown格式,这是一种标记语言,可以让prompt结构更清晰。最重要的是大模型天然能看懂这种格式的文本。

2024-06-05 08:29:35

现在,所有人都能免费用GPT-4o
OpenAI今日官宣,ChatGPT正式向所有用户免费开放!所有用户均可以访问定制化GPT、分析图表、询问有关照片的问题以及5月初GPT4o添加的其他功能。

2024-05-30 13:13:43

Linux桌面版,又被喷
提起Linux,作为服务器操作系统的绝对霸主。现在Linux在PC领域中挑战微软的Windows和苹果的macOS的底气正在初露端倪,但任重道远。

2023-07-19 21:48:45

如何使用GPT-4o函数调用构建一个实时应用程序?
我们在本教程中探讨了如何通过函数调用将实时数据引入LLM。在本系列的下一部分中,我们将把GPT4o换成GeminiPro,以探究相同的概念,但使用不同的模型。

2024-06-07 08:25:16

GPT-4o再秀神操作,“复现”OpenAI总裁讲课,网友当真
GPT4o发布以来,简直就被玩儿疯了,尤其是图像生成这块。比如有网友发现,GPT4o在组合任意图像上面就像是打通了任督二脉。

2024-05-16 12:38:05

GPT-4o 图像 方式
GPT-4o做Code Review可行吗?
总的来说,审查的性质和结果给我留下了深刻的印象。GPT4o生成的代码虽然不太理想,但也还可以。在对代码的批评中,没有“书呆子的笨拙脚步”;相反,它轻轻地引导读者走向更好的方向。

2024-05-24 14:04:04

GPT-4o“它”来了
它支持文本、音频、图像任意组合的输入输出,反应速度就像真实的人类一样。

2024-05-14 19:16:52

ChatGPT GPT-4o OpenAI
ChatGPT4o越狱,有人拿来搞大尺度!
大家知道,为了防止AI被用于不法用途,各家的AI大模型都设置了一些安全防护措施。当你尝试让AI去做一些可能涉及到违法的事情时,它会直接拒绝。

2024-06-04 08:50:35

GPT-4o:实现跨越文本与视觉的智能交互
本文通过具体的应用实例和对比测试,展示了GPT4o在问答系统和图像理解方面的实际应用,并提供了详细的集成方法和代码实现。无论是个人用户还是企业开发者,都能通过GPT4o体验到更智能、更自然的人机交互。

2024-05-17 09:35:55

GPT-4o 模型 OpenAI
革命性GPT-4o:重塑人机交互体验
GPT4o的发布无疑将大大改变AI行业和我们未来的生活。随着这种跨媒介、高响应速度、情感丰富的AI技术的普及和应用,我们将会看到更加智能、更加人性化的AI服务和产品涌现出来。

2024-05-14 08:23:27

GPT-4o AI 技术
对Linux桌面版支持的文件安装
我对FedoraLinux桌面版用的极少,感觉Fedora是实验室,新的特性都会在FedoraLinux桌面版中出现,这增强Linux桌面版的易用性;其实这也是好事。

2009-12-23 13:53:54

Linux桌面版
牵手GPT-4o能力简直王炸!奥特曼也来build现场
Phi3公开发布的时机并非巧合,人工智能PC的曙光即将到来。开发人员现在可以使用不同的变体将他们的人工智能实现带到笔记本电脑、移动设备和可穿戴设备中。​

2024-05-22 06:47:01

微软 Phi-3 人工智能
OpenAI 首次推出 GPT-4o“全能”模型,干翻所有语音助手
OpenAI的技术总监MiraMurati表示,虽然GPT4o仍然保持着GPT4的智能水平,但它在多种媒介和模式上进行了显著的提升。

2024-05-15 17:34:15

强大视听能力GPT-4o将面向所有用户,其前身正是神秘的gpt2!
如果OpenAI与微软、苹果都牵起了手,那么谷歌这个"AI届汪峰"真的要陷入孤军奋战的尴尬中了。

2024-05-14 10:14:12

GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT4o真的不可小觑,不仅在各种基准测试中稳拿第一,而且有很多发布会从未提及的惊艳功能。

2024-05-20 08:20:00

OpenAI 模型
GPT4ChatGPT大比拼:餐巾纸草图变网站,中文能力还是差!
OpenAI称GPT4是努力扩展深度学习的最新里程碑。GPT4作为一个大型多模态模型(接受图像和文本输入,发出文本输出),在各种专业和学术基准上表现出人类水平的表现。

2023-03-15 14:15:06

GPT4 ChatGPT 网站

两个鬼故事市长我爱你庄园小课堂完美的他姓薛男孩起什么名字好听张文宏辟谣win7万能声卡驱动给姓雷的男孩起名字360怎么卸载康熙起名去衣服的软件花 起名蜗居原型伊原刚志四胞胎起名非主流颓废伤感图片宋词起名 女孩姓名思聪使命召唤13姓宁女孩起名大全起名字2021起名男宝宝给小女儿起个名字www.fmx.cn火车头采集赵姓女孩起名2020Videos成熟少妇吃饺子店起名大全异镇电视剧怎么给孩子起名名字甘肃电视台少儿频道为企业起名字少年生前被连续抽血16次?多部门介入两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”淀粉肠小王子日销售额涨超10倍高中生被打伤下体休学 邯郸通报单亲妈妈陷入热恋 14岁儿子报警何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言张家界的山上“长”满了韩国人?男孩8年未见母亲被告知被遗忘中国拥有亿元资产的家庭达13.3万户19岁小伙救下5人后溺亡 多方发声315晚会后胖东来又人满为患了张立群任西安交通大学校长“重生之我在北大当嫡校长”男子被猫抓伤后确诊“猫抓病”测试车高速逃费 小米:已补缴周杰伦一审败诉网易网友洛杉矶偶遇贾玲今日春分倪萍分享减重40斤方法七年后宇文玥被薅头发捞上岸许家印被限制高消费萧美琴窜访捷克 外交部回应联合利华开始重组专访95后高颜值猪保姆胖东来员工每周单休无小长假男子被流浪猫绊倒 投喂者赔24万小米汽车超级工厂正式揭幕黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发当地回应沈阳致3死车祸车主疑毒驾恒大被罚41.75亿到底怎么缴妈妈回应孩子在校撞护栏坠楼外国人感慨凌晨的中国很安全杨倩无缘巴黎奥运校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变王树国卸任西安交大校长 师生送别手机成瘾是影响睡眠质量重要因素国产伟哥去年销售近13亿阿根廷将发行1万与2万面值的纸币兔狲“狲大娘”因病死亡遭遇山火的松茸之乡“开封王婆”爆火:促成四五十对奥巴马现身唐宁街 黑色着装引猜测考生莫言也上北大硕士复试名单了德国打算提及普京时仅用姓名天水麻辣烫把捣辣椒大爷累坏了

两个鬼故事 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化