君子好色 别再把o1满血版当聊天模子了!SpaceX前工程师公开全新使用心事:从敌视它到每天依赖它

发布日期:2025-01-14 11:02    点击次数:197

君子好色 别再把o1满血版当聊天模子了!SpaceX前工程师公开全新使用心事:从敌视它到每天依赖它

苹果 &SpaceX 前工程师共享 o1 使精心得君子好色,奥特曼、Brockman 齐转发了。

划重心:

o1 也曾不是聊天模子了,需要全新的使用体式。

奥特曼还跑去挖坟作家Ben Hylak数天前的"自我打脸"辩驳,称"不雅察 o1 的口碑变化、以及东谈主们学习怎样使用它很真义"。

Ben Hylak 曾任 SpaceX 软件工程师、苹果 VisionOS 东谈主机交互贪图师,刻下在创业为 AI 家具提供分析作事。

具体来说,Ben 在 o1 pro 推出满血 $200/ 月版块的第一天就交钱了,整整测试了一天后得出论断:它真是很晦气!

每次发问齐要恭候 5 分钟

会输出鬻矛誉盾的建议

莫得条件但老是会复兴架构图 + 上风 / 颓势列表

Ben 把晦气的体验发在网上后,好多东谈主示意同感。但真义的是,也有东谈主浓烈反对。

他开动与握不同不雅点的推敲,然后意志到正本是我方的体式全齐错了。

我还在把 o1 当聊天模子来用,但 o1 也曾不是聊天模子了。

当今,Ben 也曾从敌视 o1,转酿成了每天齐在用它措置最病笃的问题。

像对待新职工相通对待 o1

要是说 o1 不是聊天模子了,那它当今是什么?

Ben 觉得它就像一个"诠释生成器"。要是你给它毒害的凹凸文,并告诉它你想要输出什么,它时时会一次性找到措置决议。

OpenAI 官方其实给了一个浮浅的 o1 使用建议,但并不完善。

Ben 的建议包括:

提供海量配景信息

不论你当今是奈何相识"海量"的,再乘以 10 倍。

当使用 GPT-4o 或 Claude 3.5 等聊天模子时,时时会从一个浮浅的问题和一些配景信息开动。要是模子需要更多配景信息,它时时会条件你接续提供。

这便是聊天模子的骨子,从一来一趟的交互中胁制完善输出。

但 o1 只会从名义上回答你提议的问题,不会试图从你那处获得配景信息。是以需要反过来将尽可能多的凹凸文主动发给它。

即使仅仅问一个浮浅的代码工程问题,应该提供:

讲解通盘你尝试过但不起作用的决议

一份圆善的数据库 schemas

讲解一下你的公司是作念什么的,鸿沟多大,界说里面术语

一言以蔽之,就像对待新职工相通对待 o1。

时势你想要什么,而不是开发它怎样作念

关于大无数聊天模子,咱们齐会告诉模子但愿他怎样复兴模式,比如"饰演一位软件工程内行,请仔细念念考"。

但在 o1 上灵验的体式正相背,告诉它你需要什么,而不是开发它怎样去作念。

Ben 把 o1 的指示词模板分红 4 部分:

概念放在最前边

详备指定输出体式

不错附加需要检查的驻防事项

海量相干的配景信息

临了,o1 的输出有一种学术 / 贸易诠释的作风。Ben 觉得太多的推理 token 让它很难懂脱这种作风

他曾试图让 o1 来完成这篇著作,但经由屡次尝试,只可得到相称庸俗的学生功课。

One More Thing

在奥特曼的转发推文中,有东谈主套出了最新音书:

o3 暂时还不会向用户怒放,o3-mini 会先推出,况兼期间不远了。

o3-mini 会先提供给 Plus 订阅用户使用,API 的订价 OpenAI 里面还没驯服,但不会很贵。

人妖射精

参考运动:

[ 1 ] https://www.latent.space/p/o1-skill-issue

[ 2 ] https://x.com/sama/status/1877814065088663763

[ 3 ] https://x.com/gdb/status/1878489681702310392君子好色