
君子好色 别再把o1满血版当聊天模子了!SpaceX前工程师公开全新使用心事:从敌视它到每天依赖它
发布日期:2025-01-14 11:02 点击次数:197
苹果 &SpaceX 前工程师共享 o1 使精心得君子好色,奥特曼、Brockman 齐转发了。
划重心:
o1 也曾不是聊天模子了,需要全新的使用体式。
奥特曼还跑去挖坟作家Ben Hylak数天前的"自我打脸"辩驳,称"不雅察 o1 的口碑变化、以及东谈主们学习怎样使用它很真义"。
Ben Hylak 曾任 SpaceX 软件工程师、苹果 VisionOS 东谈主机交互贪图师,刻下在创业为 AI 家具提供分析作事。
具体来说,Ben 在 o1 pro 推出满血 $200/ 月版块的第一天就交钱了,整整测试了一天后得出论断:它真是很晦气!
每次发问齐要恭候 5 分钟
会输出鬻矛誉盾的建议
莫得条件但老是会复兴架构图 + 上风 / 颓势列表
Ben 把晦气的体验发在网上后,好多东谈主示意同感。但真义的是,也有东谈主浓烈反对。
他开动与握不同不雅点的推敲,然后意志到正本是我方的体式全齐错了。
我还在把 o1 当聊天模子来用,但 o1 也曾不是聊天模子了。
当今,Ben 也曾从敌视 o1,转酿成了每天齐在用它措置最病笃的问题。
像对待新职工相通对待 o1
要是说 o1 不是聊天模子了,那它当今是什么?
Ben 觉得它就像一个"诠释生成器"。要是你给它毒害的凹凸文,并告诉它你想要输出什么,它时时会一次性找到措置决议。
OpenAI 官方其实给了一个浮浅的 o1 使用建议,但并不完善。
Ben 的建议包括:
提供海量配景信息
不论你当今是奈何相识"海量"的,再乘以 10 倍。
当使用 GPT-4o 或 Claude 3.5 等聊天模子时,时时会从一个浮浅的问题和一些配景信息开动。要是模子需要更多配景信息,它时时会条件你接续提供。
这便是聊天模子的骨子,从一来一趟的交互中胁制完善输出。
但 o1 只会从名义上回答你提议的问题,不会试图从你那处获得配景信息。是以需要反过来将尽可能多的凹凸文主动发给它。
即使仅仅问一个浮浅的代码工程问题,应该提供:
讲解通盘你尝试过但不起作用的决议
一份圆善的数据库 schemas
讲解一下你的公司是作念什么的,鸿沟多大,界说里面术语
一言以蔽之,就像对待新职工相通对待 o1。
时势你想要什么,而不是开发它怎样作念
关于大无数聊天模子,咱们齐会告诉模子但愿他怎样复兴模式,比如"饰演一位软件工程内行,请仔细念念考"。
但在 o1 上灵验的体式正相背,告诉它你需要什么,而不是开发它怎样去作念。
Ben 把 o1 的指示词模板分红 4 部分:
概念放在最前边
详备指定输出体式
不错附加需要检查的驻防事项
海量相干的配景信息
临了,o1 的输出有一种学术 / 贸易诠释的作风。Ben 觉得太多的推理 token 让它很难懂脱这种作风
他曾试图让 o1 来完成这篇著作,但经由屡次尝试,只可得到相称庸俗的学生功课。
One More Thing
在奥特曼的转发推文中,有东谈主套出了最新音书:
o3 暂时还不会向用户怒放,o3-mini 会先推出,况兼期间不远了。
o3-mini 会先提供给 Plus 订阅用户使用,API 的订价 OpenAI 里面还没驯服,但不会很贵。
人妖射精参考运动:
[ 1 ] https://www.latent.space/p/o1-skill-issue
[ 2 ] https://x.com/sama/status/1877814065088663763
[ 3 ] https://x.com/gdb/status/1878489681702310392君子好色