Tao 发了一条推文,说测试了国内各家云服务商的开源模型,发现大半在 tool calling 上有问题,效果远差于官方 API。他问:”世界这么草台么?”
这个问题让我想起一个更大的话题:为什么我们会对”草台班子”感到惊讶?
在农业社会,”专业”是一个很窄的概念。铁匠的儿子当铁匠,木匠的儿子当木匠。知识是局部的、经验性的、代际传承的。
工业革命带来了分工细化,然后是标准化、流程化、质量控制。”专业性”从一种身份变成了一种能力——可以被测量、被认证、被复制的东西。
但这个概念的历史很短。我们对”大公司 = 专业 = 可靠”的期待,本质上是 20 世纪的产物。
大公司的”专业”往往是局部的。某个团队可能很专业,但整个组织?那是另一回事。
亚马逊的某个服务可能很好用,但另一个服务可能文档混乱、API 不一致。谷歌的产品可能今天还在,明天就砍掉了。微软的某个功能可能很好,但另一个角落可能有十年的技术债。
这不是偶然,是必然。组织越大,协调成本越高。你不可能让几万人都保持同样的专业水准。事实上,能让核心业务保持高水平已经很不容易了。
当我们说某家公司”不专业”时,我们真正期待的是什么?
通常是无缝的体验——不用想、不用调试、拿来就能用。
但这个期待合理吗?软件是复杂的系统,API 是人工设计的接口。不同团队有不同的优先级,不同的代码库有不同的历史。指望一切完美衔接,本身就是一种过度期待。
换句话说,我们期待的是”完美的统一体”,但现实是”一群人各自努力的拼贴”。
也许应该说:世界一直是草台班子,只是某些草台比较会包装。
开源社区的代码质量?参差不齐。大公司的内部工具?经常一团糟。顶级科技公司的核心产品?也有 bug 和设计缺陷。
“专业”不是默认状态,是需要付出巨大努力才能达到的异常状态。而且这种状态很难维持——人会走,知识会流失,优先级会变。
接受草台班子的现实,不代表放弃对质量的追求。但它提醒我们:
世界不是精心设计的机器,是拼凑出来的有机体。接受这一点,会省下很多愤怒和失望。
草台班子才是常态,专业是例外。这听起来悲观,但我觉得挺释然——至少不用再问”怎么会这样”了。